Gene Moth_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1997
Symbol
ID	3832330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2080835
End bp	2082199
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	62%
IMG OID	637829926
Product	dihydropyrimidinase
Protein accession	YP_430836
Protein GI	83590827
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type [TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCT TGCTGAAGGG CGGCTGGGTT GTTACCCAGG AGCGGGTGGA GCAGGCCGAT 
ATAGCCGTCG AAGGGGAGAA AATTGCCGCC ATAGGCCCGG ACCTGGAGGC CCGGGCGGCT 
GCCGTCAGGG ATGTCACCGG GAAATACATC CTGCCCGGCG CCATCGACGC CCACGTCCAC 
TACCAGATGC CCATCGGCGA GCTCCTGACC GCCGACGACT GGTTCACCGG TACCAGACTG 
GCAGCCTGCG GCGGGGTTAC CACCGTCATT GATTATGCCG AGCCCGCCGG CCCGGCCGAA 
CCCTTGACGG AAGCCCTGGC CAAACGCCTG GAGGAAGCCC GGGAGCAGGC GTGCGTTGAC 
TATGGTCTGC ACCAGGTGGT GCTGCCCGGC CAGGAAGAAG ACACCGGTGA GCTGGCAAAG 
GTAATAGAGC AGGGAGTCAC CAGCTTTAAA GTCTTTACCA CCTACAAGCA GTGCCTGGGT 
TACGCGGCCA TCGGCCGCCT GCTTAAGCAG GCCCGGCGGT TGGGAGCCCT GGTGACGGTT 
CACTGTGAGG ATCATGATCT GGTAACGGCC AGGCGGAGGG AACTGGAGGC TACCGGCCAG 
ACAGACCCGG CCTACCACGC CAACAGCCGG CCCGCAGCGG CCGAAGTAAA GGCCATAGAA 
AAGGTTATCC GCCAGGCAGC CGCGGCCGGG GCGCCAGTTT ATATCGTCCA TGTCTCCACC 
GGCGGGGGGG CGGAATTAAT TGCCGCCGCC CGGGCCCGAG GACAGCAGGT CTTTGGTGAA 
ACCTGCCCCC ACTACCTCTT ACTAACAGAG GAGAGGTATG CCGGTCCGGA CAGCCGCCTC 
TTCCTGATGT GCCCACCCCT GAGGACGGTA AAAGATAACC GGATTCTCTG GCAGCACCTG 
GCCAGTGGTG ATCTCCAGGT GGTAGCGACT GACCATTGCA GCTACAGCCC GGAACAGAAG 
GCTGCCGGAA CGGCTTTTTA TAACACCCCC TCGGGCGTAC CGGGGACGGA GACCCTTTTA 
CCCCTACTTT ATTCTTATGG TGTACGCCAG GGGCGGCTGA CCCTGCCGCA AATGGTCCGG 
GTGCTGGCCA CCAACCCGGC CCGCCTTTTC GGTCTTTACC CGCGTAAAGG TTGCCTGGCG 
CCGGGCAGCG ATGCCGACCT GGTGGTCTTC GACCCCAGCC AGGAGGTTAT ACTCAAGGCT 
TCTGACCTGC ATTCTGCCGC AGCTTATACC ATCTTTGAGG GCTTTGCTCT CCAGGGGTAC 
GTGGAAGCAA CCTATCTACG GGGTCGGCTT ATTTATGACC TGGGCCGTTT CCTGGGCCGG 
GCCGGTCAGG GAGAGTTTAT CCCTGGAAAA ATTACCGTCC TGTAA

Protein sequence

MDLLLKGGWV VTQERVEQAD IAVEGEKIAA IGPDLEARAA AVRDVTGKYI LPGAIDAHVH 
YQMPIGELLT ADDWFTGTRL AACGGVTTVI DYAEPAGPAE PLTEALAKRL EEAREQACVD 
YGLHQVVLPG QEEDTGELAK VIEQGVTSFK VFTTYKQCLG YAAIGRLLKQ ARRLGALVTV 
HCEDHDLVTA RRRELEATGQ TDPAYHANSR PAAAEVKAIE KVIRQAAAAG APVYIVHVST 
GGGAELIAAA RARGQQVFGE TCPHYLLLTE ERYAGPDSRL FLMCPPLRTV KDNRILWQHL 
ASGDLQVVAT DHCSYSPEQK AAGTAFYNTP SGVPGTETLL PLLYSYGVRQ GRLTLPQMVR 
VLATNPARLF GLYPRKGCLA PGSDADLVVF DPSQEVILKA SDLHSAAAYT IFEGFALQGY 
VEATYLRGRL IYDLGRFLGR AGQGEFIPGK ITVL