Gene Moth_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2095
Symbol
ID	3832461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2185054
End bp	2186439
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	58%
IMG OID	637830020
Product	cytochrome bd ubiquinol oxidase, subunit I
Protein accession	YP_430930
Protein GI	83590921
COG category	[C] Energy production and conversion
COG ID	[COG1271] Cytochrome bd-type quinol oxidase, subunit 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAC TCTTGCTGGC CCGTTGGCAA TTCGGCATAA CCTCGGTTTA CCATTTCCTC 
TTCGTCCCCC TGACCCTGGG ACTTTCTATT CTGGTGGCCA TCATGGAGAC CATCTACGTC 
CGTACTGGTG ATGAAACTTA CAAGAACATG GCCCGCTTCT GGGGCCGCCT TTTCCTGATT 
AACTTCGCCA TGGGTGTGGT GACCGGTATC GTTCAGGAGT TTCACTTCGG CATGAACTGG 
TCCGAGTACT CCCGCTTCGT CGGTGACATT TTCGGTGCCC CCCTGGCTGT GGAAGCCCTG 
GCCGCCTTCT TCCTGGAATC CACCTTCCTG GGCCTGTGGA TCTTCGGCTG GGAAAAACTC 
TCCCCGGCCC TTCATGCTGC CTGTATCTGG CTAGTAGCCT TTGCCTCTAA CCTTTCCGCC 
TTTTGGATCC TGGTGGCCAA CTCCTTCATG CAGGAACCGG TGGGTTTTAC CTTACGTAAC 
GGCCGCGCCG AGATGACGGA TTTCTTCGCC CTACTAACCA ACCCCCACGT CCTTTACCAG 
TTTCCCCATA CCGTCCTGGC CGGCTTTGTG ACGGCGGCCT TTTTCGTCAT GGGGATCAGT 
GCCTACCACC TGCTGCGGCA AAGCCAATTA GAGCCCTTCC GCCGTTCCTT CCGGCTGGCG 
CTTATCATGG GCCTCATCGG TAGCCTACTG GTGGCGGGTA TCGGACACCT CCAGGGGCAG 
CACCTGGTCG CTACCCAGCC CATGAAAATG GCGGCGGCCG AAGCCCTCTG GGACAGTGCC 
GACCCGGCGC CCCTGGCCCT GGTAGCCCTG GTCGACCAGG AAAACCAGCA AAACAACCTG 
GAGATTAAAA TCCCTGCCCT GACGAGTTTC CTGGCTTACA ATAGCTTCCG GGGCGAGGTG 
AAGGGCCTGA AGGAACTCCA GGCCGCAGCC GCGGAGCAAT ACGGCCCGGG CAATTATATA 
CCGCCGGTGG CCCCGGTATT CTGGAGCTTT CGCTTAATGA TTGCCGCCGG GCTGTGGTTG 
ATTTTGCTGT CCCTGTATAG CCTGTATCTA TGGCGTAAGG GACTACTGGA AAGTAGGCCC 
CTGGTCCTCA AAGCCCTGCT CTGGAGTATC CCGATCCCTT ACCTGGCTAA CACTGCCGGC 
TGGTTCGTGG CGGAAGTCGG CCGTTACCCC TGGATTGTTT ACGGTTTGCA ACGGCTCGAA 
GCAGCCGTCT CACCAGGGGT ATCCGCTACC GCTATCTTGA CGACCCTGGT GGCCTTTACC 
CTGCTTTACG GCCTGCTGGC TGTGGTGGAT GTCTACCTCC TGGCCAAATA CGCCCGCCAG 
GGTGTAGTAG AGCAGCCCCC TGCCGGTAAG ATGCATCCTT CCGGGGAGGT GTCGTTATGG 
ATCTGA

Protein sequence

MDALLLARWQ FGITSVYHFL FVPLTLGLSI LVAIMETIYV RTGDETYKNM ARFWGRLFLI 
NFAMGVVTGI VQEFHFGMNW SEYSRFVGDI FGAPLAVEAL AAFFLESTFL GLWIFGWEKL 
SPALHAACIW LVAFASNLSA FWILVANSFM QEPVGFTLRN GRAEMTDFFA LLTNPHVLYQ 
FPHTVLAGFV TAAFFVMGIS AYHLLRQSQL EPFRRSFRLA LIMGLIGSLL VAGIGHLQGQ 
HLVATQPMKM AAAEALWDSA DPAPLALVAL VDQENQQNNL EIKIPALTSF LAYNSFRGEV 
KGLKELQAAA AEQYGPGNYI PPVAPVFWSF RLMIAAGLWL ILLSLYSLYL WRKGLLESRP 
LVLKALLWSI PIPYLANTAG WFVAEVGRYP WIVYGLQRLE AAVSPGVSAT AILTTLVAFT 
LLYGLLAVVD VYLLAKYARQ GVVEQPPAGK MHPSGEVSLW I