Gene Moth_0880 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0880
Symbol
ID	3831518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	908922
End bp	910217
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	63%
IMG OID	637828810
Product	dihydroorotase
Protein accession	YP_429740
Protein GI	83589731
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATTT TAATAAAAGG CGGGCGGGTT ATTGACCCGG CTCGAAACCT GGATGGACGG 
CAGGACATAC TCATCGAAGG CGAGAAAATA ACTACCTTGG CAGCCAATCT CGAGGCCCCG 
GCCGGAGCGC GGGTCATCGA CGCGGGAGGC ATGATTGTCA CCCCCGGCCT TATTGATATG 
CATGTGCACC TGCGCGAACC GGGCTACGAG CAGAAGGAGA CCATCGCCAG CGGCACCCGG 
GCGGCGGCTG CCGGCGGCTT TACGGCCGTG GCCTGCATGG CCAATACCAA CCCGGTGGCC 
GACAGCGCCA GTGTTATCTA CTTTATCAAA GAAAAGGCTC GGCAGGAGGG GGTAGTCCGG 
GTTTACCCGG TGGGCGCCCT TTCCAAAGGC CTGGAAGGTA AAGAAATCGC CGAGATCGGC 
GACCTGGCGG CAGCCGGGGC GGTAGCCATC TCCGACGACG GCCGCCCGGT CATGAACGCC 
CTGGTCATGC GCCATGCCCT GGAGTACGCC AAAATGTTCA ACCTGCCGGT AATCAGCCAC 
TGCGAAGACG AAGCCCTGGC CAACGACGGC CTGATGCATG AAGGCCTGGT GGCCACCATC 
CTGGGCCTCA GGGGCATCCC GGCGGCAGCC GAGGAGGTCA TGGTGGCCCG GGATCTCATC 
CTGGCGGAAT TGACCGGGGG AAGGCTGCAC CTGGCCCATG TCAGCACGGC CGGGTCCGTC 
CGCCTCCTTA AGGAGGCCCG GGCCCGGGGG GTCAGGGTAA CGGCCGAAGC CACGCCCCAC 
CACCTCTGCC TAACGGACAT GCTGGTCCAG AGTTACGATA CCAGCACTAA AGTTAACCCG 
CCCCTGCGAC CGGCCGGCGA TGTGGCGGCA GTGGCGGCGG CCCTGGCGGC CGGCGACATC 
GACGTCATTG CCTCCGATCA CGCCCCCCAC GCCGACGAGG ATAAGGACGT GGAATACGAT 
TATGCACCCT TCGGCATGGT CGGCCTGGAA ACAGCCGTGC CCCTGGTGGT GACGGAACTG 
ATCCTACCCG GCAAATTAAC CTGGCAACAG GCCATCAAGT CCTGGACGGC AAACCCGGCC 
CGGATTCTCA ACATACCCGG CGGCAGCCTG GTCCCGGGCG GGGTGGCCGA CGTGACCATA 
ATCGACCCCG ACATGGAGAA GGAAGTCGAT GTCAACGAGT TCTATTCCCG AGGCCACAAC 
TCGCCCCTGC AGGGCCGGAA GCTCAAAGGC TGGCCGGTAT TGACCATTGT AGGCGGCCGG 
GTAGTGATGG AGAATGGGAA GATCATTGAG GAATGA

Protein sequence

MAILIKGGRV IDPARNLDGR QDILIEGEKI TTLAANLEAP AGARVIDAGG MIVTPGLIDM 
HVHLREPGYE QKETIASGTR AAAAGGFTAV ACMANTNPVA DSASVIYFIK EKARQEGVVR 
VYPVGALSKG LEGKEIAEIG DLAAAGAVAI SDDGRPVMNA LVMRHALEYA KMFNLPVISH 
CEDEALANDG LMHEGLVATI LGLRGIPAAA EEVMVARDLI LAELTGGRLH LAHVSTAGSV 
RLLKEARARG VRVTAEATPH HLCLTDMLVQ SYDTSTKVNP PLRPAGDVAA VAAALAAGDI 
DVIASDHAPH ADEDKDVEYD YAPFGMVGLE TAVPLVVTEL ILPGKLTWQQ AIKSWTANPA 
RILNIPGGSL VPGGVADVTI IDPDMEKEVD VNEFYSRGHN SPLQGRKLKG WPVLTIVGGR 
VVMENGKIIE E