Gene Moth_2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2098
Symbol
ID	3832464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2189551
End bp	2191380
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	65%
IMG OID	637830023
Product	ABC transporter related
Protein accession	YP_430933
Protein GI	83590924
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4987] ABC-type transport system involved in cytochrome bd biosynthesis, fused ATPase and permease components
TIGRFAM ID	[TIGR02868] thiol reductant ABC exporter, CydC subunit

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACCCC CGCCTCCCTC TGCTTCTCCC GCCGCCAGGG AGAATACAGA TCCCGGGGGT 
CACCGAGCAG ACTCTGGGGT TTCATATTCA AAGATTGACC CGGTCGGCAC CTTCGTCCGC 
TTGCTGGGTT TAATAGCACC GGCCTGGCAG GCCGTCCTCG GCGCCACCCT TTTGGGTTCC 
GGTACCATCG CCAGTAACAT TGGCCTCATG GCCACGGCTG CCTTCCTTAT CGCCAGCGCT 
GCCCTCCACC CGCCGGCCGG AAAACTAATG CTGGCCATAG TCGGGGTGCG CTTTTTCGGC 
ATCACCCGGG CCGTATGTCG CTACCTGGAA CGTTATGTAA ACCATAGTAT AACCCTTGGC 
ATCCTGGGCC GGTTGCGGGT TGCCTTCTAC CGGACCCTGG AACCCCTGAT CCCGGCCGGT 
TTGCAGGGCC ATCACAGCGG GGATTTGCTT AGCCGCGCTG TAGCCGACGT TGCCACCCTG 
GAGAATTTTT ACCTTCGCGT CCTGAACCCA CCCCTGGTCG CCCTGCCGGT CGCCGCCGGG 
GTTTTCCTGT TTTTGGCCCA TTTCGGCCGG ACCCTGGCCC TGGCCTGGAT GGGCGCTTTC 
CTGGCCGCCG GGGTTATCTT CCCCGTGGGC GTCACAATTG TCGGCCGGGG CGTCATGCGG 
CGCCAGGGCG AGGCCCGGGC GGCCCTGAAT ACCGCCCTGG TGGACACCGT CCAGGGCCTG 
GCCGACATCC TGGTCTTCGA TCATGGGCGG CAACAACAGG AGTACATCGC CACCCTGGAC 
CGTCAGTACC TGCATCTCCA GGGCCGTAAA GCCGGCCTGA ACGGTTTGGC GAACGCCCTC 
ACCAGCCTGG CAAGCAACCT GGCCCTGTGG GCCGTCCTGG TACTGGCCAT CCCCCTGGTA 
AACAGGGGAC AAATTGACGG CGTCTACCTG GCCATGCTGG CCCTGACGGC CGCCGCCGCC 
CTGGAAGCCG CCAAGCCCCT GCCCATGCTC TTCCCCCACC TGGAAGGGAG CCTGGCCGCC 
GCCCGCCGTA TCTTCGCCCT TAGCGACACC CGACCCGCCG GGGACCCGGC CGGCCCCGTT 
CCCCACCCCC GGGACTTTTC CCTCCGGGTC CAGGGACTGC GTTTCCGCTA CGGCCCCGGG 
GAACCACCGG CCCTGGACGG CATCGATTTT GACGTCCCCT CCGGAGCGCG GATAGCCATC 
GTCGGCCCCA GCGGCGCGGG CAAAAGTACC CTGGTTAATT TGCTCCTGCG CTTCTGGGAC 
TATGAAGAAG GAGCCATACT CCTGGGTGGC TACGACCTGA AGGCCTATCC ACCGGAGGAG 
CTACAGCGTT TCATCGGAGT TGTGGCCCAG CCAACCCATC TCTTTCACGC CACCATCGCC 
GAAAACCTGC TCCTGGCCCG ACCGGACGCG ACCCGGGAGG AGATGGAGCG GGCGGCCCGG 
GAAGCCCGGC TGCATGAGTT TATCCAGGTC CTGCCCCGGG GCTACGACAC CCTGATCGGC 
GAAGAAGGCT TTAAGCTCTC CGGCGGCCAG CGCCAGCGAC TGGCCATAGC CCGGGCCTTG 
CTGCAAAACG CCCCCATCCT CATCCTCGAT GAGGCTACGA CCGGCCTGGA TGCCGTAACA 
GAACGAGAGG TAATGGATTC CATCCGCCAC CTGATGGAGG GGCGCACCAC CCTGGTCATC 
ACCCACCGCC TGGTGGGCCT GGAAGACATG GATAAAATCC TGGTCCTTGA CAGGGGCAGG 
TTGGTCCAGC AGGGGCGGCA TGCAGAACTT CTCCGGCAGG AGGGCCTTTA CCGCCATTTG 
TGGCAACTGC AGCAGGAGGC GCTACCCTAA

Protein sequence

MLPPPPSASP AARENTDPGG HRADSGVSYS KIDPVGTFVR LLGLIAPAWQ AVLGATLLGS 
GTIASNIGLM ATAAFLIASA ALHPPAGKLM LAIVGVRFFG ITRAVCRYLE RYVNHSITLG 
ILGRLRVAFY RTLEPLIPAG LQGHHSGDLL SRAVADVATL ENFYLRVLNP PLVALPVAAG 
VFLFLAHFGR TLALAWMGAF LAAGVIFPVG VTIVGRGVMR RQGEARAALN TALVDTVQGL 
ADILVFDHGR QQQEYIATLD RQYLHLQGRK AGLNGLANAL TSLASNLALW AVLVLAIPLV 
NRGQIDGVYL AMLALTAAAA LEAAKPLPML FPHLEGSLAA ARRIFALSDT RPAGDPAGPV 
PHPRDFSLRV QGLRFRYGPG EPPALDGIDF DVPSGARIAI VGPSGAGKST LVNLLLRFWD 
YEEGAILLGG YDLKAYPPEE LQRFIGVVAQ PTHLFHATIA ENLLLARPDA TREEMERAAR 
EARLHEFIQV LPRGYDTLIG EEGFKLSGGQ RQRLAIARAL LQNAPILILD EATTGLDAVT 
EREVMDSIRH LMEGRTTLVI THRLVGLEDM DKILVLDRGR LVQQGRHAEL LRQEGLYRHL 
WQLQQEALP