Gene Moth_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2096
Symbol
ID	3832462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2186430
End bp	2187434
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	59%
IMG OID	637830021
Product	cytochrome d ubiquinol oxidase, subunit II
Protein accession	YP_430931
Protein GI	83590922
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGA ACATCCTATG GTTCATCCTG GTTACCGTTC TCTTTACCGG TTTCTTTTTC 
CTGGAAGGTT TCGACTATGG CGTCGGGATC CTGCTGCCTT TCGTGGGGAG AAACGACCTT 
GAGCGCCGAA TGGTTATTAA TAGCATTGGC CCCTTCTGGG ACGGCAACGA GGTATGGATG 
CTCACCGCCG GCGGGGCCAT GTTTGCCGCC TTCCCCCACT GGTACGCCAC CCTTTTCAGC 
GGTTTCTACC TGGCCCTGTT CTTGATCCTG GTGGCCCTGA TCCTGCGCGG TGTGGCCTTC 
GAGTTCCGCA GCAAGGACGA AAAACCTGCC TGGCGCAACC TCTGGGACTG GTTGCTCTTC 
GTGGGGAGTC TACTGCCGGC CCTCCTCTGG GGCGTAGCGA TTACCAACCT CATCCGGGGT 
GTGCCTATTG ACGCCAGGAT GCAATTTGCA GGAACCTTTT TCGATCTCCT CTCGCCCTAC 
ACCCTGCTGG GGGGGCTGGC CTTCCTCCTG GTCTTTACCC TGCAAGGAGG TCTTTTCCTG 
GCCCTGAAAA GTGAAGGTGA ACTAAAGGAG CGTTCCCGGC AGGCGGCCCT GAGGGCTGGA 
GCCGGTGCGG CCCTGGCCCT CCTCCTGCTG GTAATTATGA GTTACGGGGT CACCGATATT 
TTCAGCCGGT TCCTCCCCGG GATCCTTCTC GGGAGTGCTT TCATTACCTT GCTCCTCTCC 
CTGGCCGGTC TTTATACCCG GCGCTACGGC CCGGGCTTCC TGATGAACGG CCTGACCGTA 
ATCCTGGTCA CGGCGGGATT TTTCAGCGGG CTCTTCCCGC GGGTGATGGT CTCCAGCCTG 
AATCCGGAAT GGAGCATCAC CATTTACCGG GCCGCCTCCA GCCCCTATAC CCTTAAAGTT 
ATGACCGTCG TCGCCCTGAC TCTGGTACCC GTAGTCCTGG CCTACCAGGG GTGGACTTAC 
TGGGTCTTCC GCCAGCGCGT TAAAGCCAGG GACTTGGAGT ATTAG

Protein sequence

MDLNILWFIL VTVLFTGFFF LEGFDYGVGI LLPFVGRNDL ERRMVINSIG PFWDGNEVWM 
LTAGGAMFAA FPHWYATLFS GFYLALFLIL VALILRGVAF EFRSKDEKPA WRNLWDWLLF 
VGSLLPALLW GVAITNLIRG VPIDARMQFA GTFFDLLSPY TLLGGLAFLL VFTLQGGLFL 
ALKSEGELKE RSRQAALRAG AGAALALLLL VIMSYGVTDI FSRFLPGILL GSAFITLLLS 
LAGLYTRRYG PGFLMNGLTV ILVTAGFFSG LFPRVMVSSL NPEWSITIYR AASSPYTLKV 
MTVVALTLVP VVLAYQGWTY WVFRQRVKAR DLEY