Gene EcHS_A3807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3807
Symbol	mtlD
ID	5593042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3800954
End bp	3802102
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	640922919
Product	mannitol-1-phosphate 5-dehydrogenase
Protein accession	YP_001460397
Protein GI	157163079
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TACATTTTGG CGCAGGTAAT ATCGGTCGTG GCTTTATCGG TAAACTGCTG 
GCAGACGCGG GTATCCAACT GACGTTTGCC GATGTCAATC AGGTGGTACT TGATGCCCTG 
AATGCCCGTC ATAGCTATCA GGTACATGTG GTTGGTGAAA CCGAGCAGGT AGATACCGTT 
TCCGGCGTCA ATGCTGTCAG CAGCATTGGT GATGATGTCG TTGATCTGAT TGCTCAGGTT 
GATTTAGTCA CTACCGCCGT TGGCCCGGTT GTGCTGGAAC GTATTGCTCC GGCAATCGCC 
AAAGGGCTGG TGAAACGTAA AGAACAAAGT AATGAATCCC CGCTGAACAT CATCGCCTGT 
GAAAACATGG TACGCGGTAC CACGCAGCTG AAAGGCCATG TGATGAACGC CCTGCCGGAA 
GACGCCAAAG CGTGGGTAGA AGAACACGTT GGCTTTGTCG ATTCCGCCGT TGACCGCATC 
GTACCGCCTT CGGCTTCGGC AACTAACGAT CCGCTGGAAG TGACGGTAGA AACTTTCAGC 
GAATGGATTG TCGATAAAAC GCAGTTCAAA GGCGCACTGC CGAACATCCC AGGCATGGAG 
TTAACCGACA ACCTGATGGC ATTTGTCGAA CGTAAACTCT TCACCCTGAA CACGGGTCAT 
GCTATAACCG CGTACCTCGG AAAACTGGCC GGTCATCAGA CCATTCGTGA CGCGATTCTC 
GACGAGAAAA TCCGCGCGGT GGTAAAAGGT GCGATGGAAG AAAGTGGTGC AGTATTGATC 
AAGCGCTACG GCTTTGACGC TGACAAGCAT GCGGCGTACA TCCAGAAAAT CCTCGGTCGT 
TTTGAGAACC CGTATCTGAA AGATGATGTT GAGCGCGTAG GCCGTCAGCC GCTGCGTAAA 
CTGAGTGCTG GCGACCGTCT GATCAAGCCA CTGCTCGGTA CGCTGGAATA TGGTCTGCCA 
CATAAAAACC TGATTGAAGG TATTGCCGCT GCAATGCACT TCCGCAGTGA AGATGATCCG 
CAGGCTCAGG AACTGGCAGC ACTGATCGCT GACAAAGGTC CGCAGGCGGC GCTGGCACAG 
ATTTCTGGTC TTGATGCCAA CAGCGAGGTT GTATCCGAGG CGGTAACCGC TTATAAAGCA 
ATGCAATAA

Protein sequence

MKALHFGAGN IGRGFIGKLL ADAGIQLTFA DVNQVVLDAL NARHSYQVHV VGETEQVDTV 
SGVNAVSSIG DDVVDLIAQV DLVTTAVGPV VLERIAPAIA KGLVKRKEQS NESPLNIIAC 
ENMVRGTTQL KGHVMNALPE DAKAWVEEHV GFVDSAVDRI VPPSASATND PLEVTVETFS 
EWIVDKTQFK GALPNIPGME LTDNLMAFVE RKLFTLNTGH AITAYLGKLA GHQTIRDAIL 
DEKIRAVVKG AMEESGAVLI KRYGFDADKH AAYIQKILGR FENPYLKDDV ERVGRQPLRK 
LSAGDRLIKP LLGTLEYGLP HKNLIEGIAA AMHFRSEDDP QAQELAALIA DKGPQAALAQ 
ISGLDANSEV VSEAVTAYKA MQ