Gene EcolC_2426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2426
Symbol
ID	6066264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2674769
End bp	2675839
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	641601835
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_001725387
Protein GI	170020433
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.260612
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TGATCAATGA TGTGCAAGAC GTACTGGACG AACAACTGGC AGGACTGGCG 
AAAGCGCATC CATCGCTGAC ACTGCATCAG GATCCGGTGT ATGTCACCCG AGCTGATGCC 
CCTGTTGCAG GAAAAGTCGC CCTGCTGTCG GGTGGCGGCA GCGGACACGA GCCGATGCAC 
TGTGGTTATA TCGGTCAGGG GATGCTTTCG GGGGCCTGTC CGGGCGAAAT TTTCACCTCA 
CCGACGCCCG ATAAAATCTT TGAATGCGCC ATGCAAGTTG ATGGCGGCGA AGGTGTACTG 
TTGATTATCA AAAATTACAC CGGCGATATT CTTAACTTTG AAACAGCGAC CGAGTTACTG 
CACGATAGCG GCGTAAAAGT GACCACTGTG GTCATTGATG ACGACGTTGC GGTAAAAGAC 
AGTCTTTATA CTGCCGGGCG ACGCGGCGTT GCCAACACCG TATTAATTGA AAAACTCGTA 
GGCGCAGCGG CGGAGCGTGG CGACTCACTG GACGCCTGTG CGGAACTGGG GCGTAAGCTG 
AATAATCAAG GCCACTCAAT AGGTATCGCT CTCGGTGCCT GTACCGTTCC TGCCGCGGGC 
AAACCTTCTT TTACCCTGGC GGATAATGAG ATGGAGTTTG GCGTCGGCAT TCATGGTGAG 
CCGGGTATTG ACCGCCGCCC CTTCTCTTCC CTTGATCAAA CCGTCGATGA AATGTTCGAC 
ACCCTGCTGG TAAATGGCTC ATACCATCGC ACTTTGCGTT TCTGGGATTA TCAACAAGGC 
AGTTGGCAGG AAGAACAACA AACCAAACAA CCGCTCCAGT CTGGCGATCG GGTGATTGCG 
CTGGTTAACA ATCTTGGCGC AACTCCGCTT TCTGAGCTGT ACGGCGTCTA TAACCGCCTG 
ACCACACGTT GCCAGCAAGC GGGATTGACT ATCGAACGTA ATTTAATTGG CGCGTACTGC 
ACCTCACTGG ATATGACCGG TTTCTCAATC ACCTTACTGA AAGTTGATGA CGAAACGCTG 
GCACTCTGGG ACGCCCCGGT CCACACCCCG GCCCTTAACT GGGGTAAATA A

Protein sequence

MKKLINDVQD VLDEQLAGLA KAHPSLTLHQ DPVYVTRADA PVAGKVALLS GGGSGHEPMH 
CGYIGQGMLS GACPGEIFTS PTPDKIFECA MQVDGGEGVL LIIKNYTGDI LNFETATELL 
HDSGVKVTTV VIDDDVAVKD SLYTAGRRGV ANTVLIEKLV GAAAERGDSL DACAELGRKL 
NNQGHSIGIA LGACTVPAAG KPSFTLADNE MEFGVGIHGE PGIDRRPFSS LDQTVDEMFD 
TLLVNGSYHR TLRFWDYQQG SWQEEQQTKQ PLQSGDRVIA LVNNLGATPL SELYGVYNRL 
TTRCQQAGLT IERNLIGAYC TSLDMTGFSI TLLKVDDETL ALWDAPVHTP ALNWGK