Gene EcHS_A1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1302
Symbol	dhaM
ID	5593672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1296135
End bp	1297553
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	50%
IMG OID	640920459
Product	dihydroxyacetone kinase subunit M
Protein accession	YP_001458020
Protein GI	157160702
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01003] Phosphotransferase System HPr (HPr) Family [TIGR02364] dihydroxyacetone kinase, phosphotransfer subunit

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAACC TGGTCATAGT TTCACATAGC AGCCGACTGG GAGAAGGTGT CGGTGAATTA 
GCCCGTCAGA TGTTAATGAG TGATAGTTGT AAAATCGCCA TTGCCGCGGG AATTGACGAT 
CCACAAAATC CCATTGGTAC CGATGCCGTC AAAGTGATGG AGGCCATCGA ATCTGTTGCT 
GATGCCGACC ATGTGCTGGT CATGATGGAT ATGGGTAGCG CATTATTGAG TGCTGAAACT 
GCGCTGGAAT TGCTGGCTCC CGAGATCGCC GCAAAAGTAC GTTTGTGTGC TGCGCCGTTG 
GTCGAAGGTA CACTGGCAGC AACGGTCAGC GCGGCCTCGG GAGCGGATAT CGACAAAGTT 
ATCTTTGACG CTATGCATGC GCTGGAAGCC AAACGTGAAC AACTGGGTTT ACCGTCCTCC 
GACACTGAAA TCTCTGACAC ATGTCCTGCG TACGATGAAG AAGCCCGTTC TCTGGCGGTG 
GTCATAAAAA ACCGTAACGG CCTGCATGTA CGTCCGGCCT CCCGGCTGGT TTATACCTTA 
TCGACATTTA ATGCCGATAT GTTGCTGGAA AAAAACGGCA AATGCGTCAC ACCAGAGAGT 
ATTAACCAGA TTGCGTTACT ACAAGTTCGC TATAACGATA CGCTGCGCCT GATTGCGAAA 
GGGCCAGAAG CTGAAGAGGC ACTGATCGCT TTCCGTCAGC TGGCTGAAGA TAACTTTGGT 
GAAACGGAGG AAGTCGCTCC ACCTACTCTG CGTCCCGTTC CGCCTGTTTC GGGTAAAGCC 
TTTTATTATC AACCAGTTTT ATGTACGGTA CAGGCAAAAT CAACCCTGAC CGTGGAAGAA 
GAACAAGAAC GATTACGCCA GGCTATTGAC TTCACGTTAT TAGATCTGAT GACGTTAACA 
GCGAAAGCAG AAGCCAGCGG GCTTGACGAT ATTGCCGCAA TCTTTTCTGG TCACCATACA 
CTGTTAGATG ATCCGGAACT GCTGGCGGCG GCAAGCGAAC TCCTTCAGCA TGAACATTGC 
ACGGCAGAAT ATGCCTGGCA GCAAGTTCTT AAAGAACTTA GCCAGCAATA CCAGCAACTG 
GATGATGAAT ATCTACAAGC TCGCTATATT GATGTGGACG ATCTTCTGCA TCGCACCCTG 
GTCCACCTGA CCCAAACGAA AGAAGAACTC CCGCAGTTTA ACTCGCCAAC TATTCTACTG 
GCGGAGAACA TTTATCCTTC CACAGTACTG CAACTGGATC CGGCGGTTGT AAAAGGTATC 
TGCCTTAGCG CCGGAAGTCC GGTATCCCAC AGCGCCCTAA TCGCCCGTGA ACTGGGGATT 
GGCTGGATTT GCCAGCAGGG TGAGAAACTG TATGCGATAC AACCAGAAGA AACGCTAACG 
CTGGACGTTA AAACGCAACG TTTCAACCGT CAGGGTTAA

Protein sequence

MVNLVIVSHS SRLGEGVGEL ARQMLMSDSC KIAIAAGIDD PQNPIGTDAV KVMEAIESVA 
DADHVLVMMD MGSALLSAET ALELLAPEIA AKVRLCAAPL VEGTLAATVS AASGADIDKV 
IFDAMHALEA KREQLGLPSS DTEISDTCPA YDEEARSLAV VIKNRNGLHV RPASRLVYTL 
STFNADMLLE KNGKCVTPES INQIALLQVR YNDTLRLIAK GPEAEEALIA FRQLAEDNFG 
ETEEVAPPTL RPVPPVSGKA FYYQPVLCTV QAKSTLTVEE EQERLRQAID FTLLDLMTLT 
AKAEASGLDD IAAIFSGHHT LLDDPELLAA ASELLQHEHC TAEYAWQQVL KELSQQYQQL 
DDEYLQARYI DVDDLLHRTL VHLTQTKEEL PQFNSPTILL AENIYPSTVL QLDPAVVKGI 
CLSAGSPVSH SALIARELGI GWICQQGEKL YAIQPEETLT LDVKTQRFNR QG