Gene Moth_1108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1108
Symbol
ID	3833074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1134624
End bp	1136081
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	57%
IMG OID	637829036
Product	inosine-5'-monophosphate dehydrogenase
Protein accession	YP_429965
Protein GI	83589956
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0516] IMP dehydrogenase/GMP reductase [COG0517] FOG: CBS domain
TIGRFAM ID	[TIGR01302] inosine-5'-monophosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.927877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGACGG ATAAAATAAT TGGCGAGGGT TTAACTTTTG ATGACGTCCT CCTGGTCCCC 
GGTGAATCAG AGGTGTTACC GCGGGAAGTT GATATCAGCT CCAATTTTAC CCGTCATATT 
CGCCTCAATA CTCCCCTGGT GAGCGCTGCC ATGGATACAG TGACTGAGGC CCGGACGGCG 
ATCAGCATGG CCCGGGAGGG GGGCATCGGC GTTATCCATA AGAACATGAC CATCGAACGC 
CAGGCCAGGG AGGTCGACCG GGTCAAGCGT TCAGAACATG GCGTCATTAC TGACCCCATT 
TCCTTGAGCC CGGATCATAA GGTCCGGGAA GCCATCGCCC TGATGGAGCA CTACCATATC 
TCAGGGGTTC CCATTACCGA TAATGGTAAG CTGGTAGGCA TCATTACCAA CCGGGATATA 
CGTTTTGAAG ACAACCACGA GCGGCCTATT AAGGAGGTTA TGACCAAAGA CAACCTGGTA 
ACGGCGCCGG TAGGTACTAC CCTGGCCGAG GCCATGGCCA TTTTAAGGGC CCACAAGATT 
GAGAAACTCC CCCTGGTAGA CGCCGACTAT AACTTGAAGG GGCTAATTAC CATCAAGGAT 
ATTGAGAAGA CACGCCGGTA TCCACAGGCC GCCAAGGATG AGAGGGGGCG CCTGCGGGTG 
GCAGCGGCAG TGGGTACCTC AGCCGATACC ATGACCAGGG TAGAGGCCCT GGTAGCCGCC 
GGGGTAGACG CCATTGTTGT GGATACAGCC CATGGCCAGT CCCGGAGTGT TATTGAAACA 
GTGAAACGTA TCAAGGCTGC CTTCCCGGCG GTGGAGCTGG TGGCCGGTAA TGTAGCAACT 
TACGACGGCG CCCGGGCCCT GGCTGAGGCC GGGTTTGACG CCGTGAAGGT TGGGGTTGGA 
CCAGGTTCCA TTTGTACTAC CAGGGTTATC GCCGGCATTG GCGTCCCCCA GATTACGGCA 
GTGATGGAGT GCGCCCGGGC AGCGGCGGAG TTTGGTATTC CGGTAATTGC CGATGGGGGT 
ATTAAATACT CCGGTGATAT TACCAAGGCC ATTGCCGCCG GCGCCAACAC AGTAATGATC 
GGCAGTCTCC TGGCCGGCAC AGAGGAAAGC CCTGGTGAGA TTGAAATCTT CCAGGGCCGC 
AGTTTTAAGA GTTATCGCGG CATGGGTTCC CTCGCGGCCA TGAAGGAAGG CAGTAAAGAC 
CGCTATTTCC AGGAAGAAGC CGAAAAACTG GTACCGGAAG GGATTGAAGG CCGCGTCCCT 
TATAAAGGCC CCCTCTCGGA GACTATTTTC CAGCTGGTGG GCGGTTTACG AGCCGGCATG 
GGTTACTGTG GTGCCCGTAA TATCGCTGAA CTCCAGGCCC GAGGGCGCTT TATCCGCATT 
ACCCCGGCGG GCCTGCGGGA GAGCCATCCC CATGACGTGA TGATCACCAA AGAAGCCCCC 
AACTACCGTA TTTCCTAG

Protein sequence

MTTDKIIGEG LTFDDVLLVP GESEVLPREV DISSNFTRHI RLNTPLVSAA MDTVTEARTA 
ISMAREGGIG VIHKNMTIER QAREVDRVKR SEHGVITDPI SLSPDHKVRE AIALMEHYHI 
SGVPITDNGK LVGIITNRDI RFEDNHERPI KEVMTKDNLV TAPVGTTLAE AMAILRAHKI 
EKLPLVDADY NLKGLITIKD IEKTRRYPQA AKDERGRLRV AAAVGTSADT MTRVEALVAA 
GVDAIVVDTA HGQSRSVIET VKRIKAAFPA VELVAGNVAT YDGARALAEA GFDAVKVGVG 
PGSICTTRVI AGIGVPQITA VMECARAAAE FGIPVIADGG IKYSGDITKA IAAGANTVMI 
GSLLAGTEES PGEIEIFQGR SFKSYRGMGS LAAMKEGSKD RYFQEEAEKL VPEGIEGRVP 
YKGPLSETIF QLVGGLRAGM GYCGARNIAE LQARGRFIRI TPAGLRESHP HDVMITKEAP 
NYRIS