Gene Moth_1456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1456
Symbol
ID	3831342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1502035
End bp	1503696
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	57%
IMG OID	637829389
Product	ABC transporter related
Protein accession	YP_430309
Protein GI	83590300
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR01166] cobalt transport protein ATP-binding subunit

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.539244
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCTTAT TTCAAAGCGA AAATTTAATT TATTACTACC CGGATAGGGA AAAGCCGGCC 
TTGAAAGATA TCAATTTGCG TATTGAAGAA GGGGAGTTTT TATTGATAAC CGGCGGTTCG 
GGATCGGGTA AGTCTACCTT AGCGCGGGTG CTGGCCGGCC TGATCCCGGA TTTTTACGGC 
GGCCGCTTTG GTGGCAAGGT TTATTTTCAA GGGCGGGACA TGGGCCAGAT GAACCGGCGA 
AAACTGGCCC GGGAAGTGGG GATGGTCTTC CAGGATCCGG AAAAACAACT GGTTATGACC 
AGTGTCGAGG CCGAGATCGC CTTCGGCCTG GAAAACCTGG GTCTGCCCCG GGCAGAGATG 
TCCCGGCGGG TTGCCGAGGT CTTGAGTTTT CTGGACCTGA CGGAAGTCAG GCAGGAATTT 
ACCGCGCACC TTTCCGGTGG GCAGAAGCAA AAGCTGGCCC TGGCTGCTAT ACTGGCCATG 
CAGCCGCGGG TGCTGGTTTT AGATGAGCCT ACCTCCCAGC TGGACCCGGT AGCGGCCGAG 
GAATTTTTTA ATCTCATTAA ACGGTTAAAT GAGGAAATGG GCCTGACCAT AATTTTGATC 
GAGCAGCGGC TGGAGAGGTG TTATCACCTG GCCGACCGGG TAGTGTTCAT GGAGGACGGC 
CAGCTCAAAT ATGAGGGCAC GCCGGAGCAA CTGGCCCGCT GGGCGGTGCA GCGGGACATC 
CCCTTTGTAC CCCCGGTGGC CCGTTTTTTT GCCCGGATAG GTTTCCCTTC TATTCCCGTT 
ACCGTCAAGG AAGGGCGCCG GTTACTGCGG TCCAACTTTG ACCGCCGGGA GTTTCCCCCT 
CTAAAGCCGG CGGTAAAGGC AGAACCGGGA GAACCGGTTT TGACCATGAG TAAGGTATGG 
TTTACCTATC CCAATGGTAA AGAAGCCCTG CAGGACGTAA GTATCCAAAT CGCTACCGGC 
GAACTGGTAG CTATCCTGGG CGCCAACGGC GCCGGTAAAT CCACCCTCCT GAAAACCATG 
GCCGGCCTCT TAAAACCGGG ACGGGGCCGG GTGCAGGTAA TGGGCCGCGA CCTGAGTAAC 
GAGGGCCGGC CCGGGGACGG CAGGATTGCC TACCTTTCCC AGAATCCCGG TGATTATCTC 
TTCCAGGATA CCGTGGAAGA GGAATTGTTA TTTACTCTAA AAAATTTCGG CCTCCCTAAT 
GACGGCATTG TTGATGAACT CCTGGAGAAG TTAAACCTAC AGCGCTACCG GCGGGTAAAC 
CCGCGCGATT TGAGCAGCGG CGAGCGCCAG CGGGTCGCCC TGGCCTCCAT TTTGGTAACA 
CGGCCCCGGC TCCTGGTGCT TGACGAACCT ACCCGGGGGA TGGATTATCG CTTGAAGGAC 
GAACTGGGAG AATTGTTGAC GGGCTTAAGG AGGGAGGGAG TAAGTGTGGT GCTGGTGACC 
CATGATATAG AATTTGCTGC TGCTTATGCC ACGCGGGTGC TGCTGCTGTT TGCCGGCCGG 
ATCGTAGCCG ATGGGCCCAA GCACCAGGTC CTGGGCCAGT CGGTTTTTTA TTCCACCCAG 
ATTGGCAAAA TGTGCCGCGG CTATGTTGAC GGTGTCCTGA CCCTGCAGGA TGCCCTGGAC 
CGGCTGGCAC CCGCATGGCC GGCCAGGCAG GTAGTTTCAT AA

Protein sequence

MPLFQSENLI YYYPDREKPA LKDINLRIEE GEFLLITGGS GSGKSTLARV LAGLIPDFYG 
GRFGGKVYFQ GRDMGQMNRR KLAREVGMVF QDPEKQLVMT SVEAEIAFGL ENLGLPRAEM 
SRRVAEVLSF LDLTEVRQEF TAHLSGGQKQ KLALAAILAM QPRVLVLDEP TSQLDPVAAE 
EFFNLIKRLN EEMGLTIILI EQRLERCYHL ADRVVFMEDG QLKYEGTPEQ LARWAVQRDI 
PFVPPVARFF ARIGFPSIPV TVKEGRRLLR SNFDRREFPP LKPAVKAEPG EPVLTMSKVW 
FTYPNGKEAL QDVSIQIATG ELVAILGANG AGKSTLLKTM AGLLKPGRGR VQVMGRDLSN 
EGRPGDGRIA YLSQNPGDYL FQDTVEEELL FTLKNFGLPN DGIVDELLEK LNLQRYRRVN 
PRDLSSGERQ RVALASILVT RPRLLVLDEP TRGMDYRLKD ELGELLTGLR REGVSVVLVT 
HDIEFAAAYA TRVLLLFAGR IVADGPKHQV LGQSVFYSTQ IGKMCRGYVD GVLTLQDALD 
RLAPAWPARQ VVS