Gene Moth_0430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0430
Symbol
ID	3830954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	433790
End bp	434869
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	43%
IMG OID	637828365
Product	mannonate dehydratase
Protein accession	YP_429304
Protein GI	83589295
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1312] D-mannonate dehydratase
TIGRFAM ID	[TIGR00695] mannonate dehydratase

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.174722
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGA CATTTAGATG GTTCGGAGAG GGCTATGATA GTATCTCTTT GGATAAAATC 
AGGCAAATAC CGGGGAAGCC CGGGATTGTA AGCGCTATTT ATGATGTACC TGTGGGCGAA 
GTATGGCCTG AAGAAAAAAT AAAAAAATTA AAGGAGACAG TAGAAAATGC GGGACTGGAA 
TTAGAGGTCA TAGAAAGCGT TAATGTCCAT GAGGATATCA AACTTGGACT TCCCAGTAGG 
GACCGTTATA TTGAGAACTA CCAGCAGACC TTGAGAAATC TGGCTAAATT CGGCATTAAG 
GTCGTGTGCT ACAATTTTAT GCCCATATTT GATTGGACAC GGTCGGATTT AGCGAAAGTC 
CTGCCAGATG GTTCCACTGC TCTTTCCTAT GAAGAGGAAA AGGTACAGAA GGTGGACCCC 
AATAGGATGG TGGAAGAAGT AGAGGCCAAC TCTAACGGCT TTGAGCTGCC TGGCTGGGAG 
CCTGAAAGAC TTAAAACACT AAAGGTGCTG TTTGAACAAT ACAAGAGTGT GGATGAGGAA 
AAGCTATTAA AAAACCTGGG GTATTTTTTA AGGGCAATTA TTCCTGTGGC TGAAGAAGTT 
GATATAAAAA TGGCCATTCA TCCCGACGAT CCGCCGTGGT CTATATTTGG TCTTCCCAGG 
ATTGTAAAAT CCAAAGAAAG CCTGGAAAAG ATCATGGCCC TGGTAGACAG CCCCTACAAT 
GGTATCACAC TATGTAGTGG TAGTCTTGGG GCAAATCCGG ACAACGATAT TCCTGCTCTT 
ATACGCTATT TCGGCGCTAA AGGAAGAATA CACTTCGGTC ATGTAAGGAA TATTAAGATA 
CATTCACTCC GCAATTTTGA TGAGTCTTCT CATTTGTCTT CGGATGGATC TTTGGATATG 
TTTGAGATTA TGAAGGCATA CCATGATATT GATTTCAAGG GATATATCAG GCCGGACCAT 
GGTCGAATGA TCTGGGGAGA AGTAGGCAGG CCTGGGTATG GCCTGTATGA CAGGGCTCTT 
GGGATCGCCT ATCTGAACGG GTTATGGGAA GCAATTGGTA AAATGAAAAA GGTATGTTAA

Protein sequence

MKMTFRWFGE GYDSISLDKI RQIPGKPGIV SAIYDVPVGE VWPEEKIKKL KETVENAGLE 
LEVIESVNVH EDIKLGLPSR DRYIENYQQT LRNLAKFGIK VVCYNFMPIF DWTRSDLAKV 
LPDGSTALSY EEEKVQKVDP NRMVEEVEAN SNGFELPGWE PERLKTLKVL FEQYKSVDEE 
KLLKNLGYFL RAIIPVAEEV DIKMAIHPDD PPWSIFGLPR IVKSKESLEK IMALVDSPYN 
GITLCSGSLG ANPDNDIPAL IRYFGAKGRI HFGHVRNIKI HSLRNFDESS HLSSDGSLDM 
FEIMKAYHDI DFKGYIRPDH GRMIWGEVGR PGYGLYDRAL GIAYLNGLWE AIGKMKKVC