Gene EcE24377A_1346 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1346
Symbol	dhaK
ID	5587160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1340450
End bp	1341520
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	640925042
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_001462451
Protein GI	157158476
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TGATCAATGA TGTGCAAGAC GTACTGGACG AACAACTGGC AGGACTGGCG 
AAAGCGCATC CATCGCTGAC ACTGCATCAG GATCCGGTGT ATGTCACCCG AGCTGATGCC 
CCTGTTGCAG GAAAAGTCGC CCTGCTGTCG GGTGGCGGCA GCGGACACGA GCCGATGCAC 
TGTGGTTATA TCGGTCAGGG GATGCTTTCG GGGGCCTGTC CGGGCGAAAT TTTCACCTCA 
CCGACGCCCG ATAAAATCTT TGAATGCTCC ATGCAAATTG ATGGCGGCGA AGGTGTACTG 
TTGATTATCA AAAATTACAC CGGCGATATT CTTAACTTTG AAACAGCGAC CGAGTTACTG 
CACGATAGCG GCGTAAAAGT GACCACTGTG GTCATTGATG ACGACGTTGC GGTAAAAGAC 
AGTCTTTATA CCGCCGGGCG ACGCGGCGTT GCCAACACCG TATTAATTGA AAAACTCGTA 
GGCGCAGCGG CGGAGCGTGG CGACTCACTG GACGCCTGTG CGGAACTGGG GCGTAAGTTG 
AATAATCAAG GCCACTCAAT AGGTATCGCT CTCGGTGCCT GTACCGTTCC TGCCGCGGGC 
AAACCTTCTT TTACCCTGGC GGATAATGAG ATGGAGTTTG GCGTCGGCAT TCATGGTGAG 
CCGGGTATTG ACCGCCGCTC CTTCTCTTCC CTTGATCAAA CCGTCGATGA AATGTTCGAC 
ACCCTGCTGG AAAATGGCTC ATACCATCGC ACTTTGCGTT TCTGGGATTA TCAACAAGGC 
AGTTGGCAGG AAGAACAACA AACCAAACAA CCGCTCCAGT CTGGCGATCG GGTGATTGCG 
CTGGTTAACA ATCTTGGCGC AACTCCGCTT TCTGAGCTGT ACGGCGTCTA TAACCGCCTG 
ACCACACGTT GCCAGCAAGC GGGATTGACT ATCGAACGTA ATTTAATTGG CGCGTACTGC 
ACCTCACTGG ATATGACCGG TTTCTCAATC ACCTTACTGA AAGTTGATGA CGAAACGCTG 
GCACTCTGGG ACGCCCCGGT CCACACCCCG GCCCTTAACT GGGGTAAATA A

Protein sequence

MKKLINDVQD VLDEQLAGLA KAHPSLTLHQ DPVYVTRADA PVAGKVALLS GGGSGHEPMH 
CGYIGQGMLS GACPGEIFTS PTPDKIFECS MQIDGGEGVL LIIKNYTGDI LNFETATELL 
HDSGVKVTTV VIDDDVAVKD SLYTAGRRGV ANTVLIEKLV GAAAERGDSL DACAELGRKL 
NNQGHSIGIA LGACTVPAAG KPSFTLADNE MEFGVGIHGE PGIDRRSFSS LDQTVDEMFD 
TLLENGSYHR TLRFWDYQQG SWQEEQQTKQ PLQSGDRVIA LVNNLGATPL SELYGVYNRL 
TTRCQQAGLT IERNLIGAYC TSLDMTGFSI TLLKVDDETL ALWDAPVHTP ALNWGK