Gene EcSMS35_3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3933
Symbol	mtlD
ID	6142775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4009933
End bp	4011081
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	641618759
Product	mannitol-1-phosphate 5-dehydrogenase
Protein accession	YP_001745898
Protein GI	170681271
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAT TACATTTTGG CGCAGGTAAT ATCGGTCGTG GCTTTATCGG TAAACTGCTG 
GCAGACGCGG GTATCCAACT GACGTTTGCC GATGTCAATC AGGTGGTACT TGATGCCCTG 
AATGCCCGTC ATAGCTATCA GGTTCATGTG GTTGGTGAAA CCGAGCAGGT AGATACCGTT 
TCCGGCGTCA ATGCTGTCAG CAGCATTGGT GATGATGTCG TTGATCTGAT TGCTCAGGTT 
GATTTAGTCA CTACCGCCGT GGGCCCGGTT GTGCTGGAAC GTATTGCCCC GGCAATCGCC 
AAAGGGCTGG TGAAACGTAA AGAACAAGGT AATGAATCCC CGCTGAACAT CATCGCTTGT 
GAAAACATGG TCCGCGGCAC CACACAGCTG AAAGGACATG TGATGAACGC CCTGCCGGAA 
GATGCCAAAG CGTGGGTAGA AGAACACGTT GGCTTTGTTG ATTCCGCCGT TGACCGCATC 
GTGCCGCCTT CGGCTTCTGC AACCAACGAT CCGCTGGAAG TGACGGTAGA AACATTCAGC 
GAATGGATTG TTGATAAAAC CCAGTTCAAA GGCGCGCTGC CGAACATCCC AGGCATGGAG 
TTAACCGACA ACCTGATGGC ATTTGTCGAA CGTAAACTCT TCACCCTGAA TACGGGTCAT 
GCTATAACCG CGTACCTCGG AAAACTGGCG GGTCATCAGA CCATTCGTGA TGCGATTCTC 
GACGAGAAAA TCCGCGCGGT GGTAAAAGGT GCGATGGAAG AAAGCGGTGC GGTACTGATC 
AAGCGCTACG GCTTTGACGC AGACAAGCAT GCGGCATACA TCCAGAAAAT CCTCGGTCGT 
TTCGAAAACC CGTATCTGAA AGATGATGTA GAGCGCGTAG GCCGTCAGCC GCTGCGTAAA 
CTGAGCGCTG GTGACCGTCT GATTAAGCCA CTGCTCGGTA CACTGGAATA TGGTCTGCCA 
CATAAAAACC TGATTGAAGG TATTGCCGCT GCAATGCACT TCCGCAGTGA AGATGATCCG 
CAGGCTCAGG AACTGGCAGC ACTGATCGCT GACAAAGGTC CGCAGGCGGC GCTGGCACAG 
ATTTCCGGTC TTGATGCCAA CAGCGAGGTT GTATCCGAGG CGGTAACCGC TTATAAAGCA 
ATGCAATAA

Protein sequence

MKALHFGAGN IGRGFIGKLL ADAGIQLTFA DVNQVVLDAL NARHSYQVHV VGETEQVDTV 
SGVNAVSSIG DDVVDLIAQV DLVTTAVGPV VLERIAPAIA KGLVKRKEQG NESPLNIIAC 
ENMVRGTTQL KGHVMNALPE DAKAWVEEHV GFVDSAVDRI VPPSASATND PLEVTVETFS 
EWIVDKTQFK GALPNIPGME LTDNLMAFVE RKLFTLNTGH AITAYLGKLA GHQTIRDAIL 
DEKIRAVVKG AMEESGAVLI KRYGFDADKH AAYIQKILGR FENPYLKDDV ERVGRQPLRK 
LSAGDRLIKP LLGTLEYGLP HKNLIEGIAA AMHFRSEDDP QAQELAALIA DKGPQAALAQ 
ISGLDANSEV VSEAVTAYKA MQ