Gene B21_01185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01185
Symbol	dhaK
ID	8114517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1237324
End bp	1238394
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	644847438
Product	hypothetical protein
Protein accession	YP_002999011
Protein GI	251784707
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.898254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TGATCAATGA TGTGCAAGAC GTACTGGACG AACAACTGGC AGGACTGGCG 
AAAGCGCATC CATCGCTGAC ACTGCATCAG GATCCGGTGT ATGTCACCCG AGCTGATGCC 
CCTGTTGCAG GAAAAGTCGC CCTGCTGTCG GGTGGCGGCA GCGGACACGA GCCGATGCAC 
TGTGGTTATA TCGGTCAGGG GATGCTTTCG GGGGCCTGTC CGGGCGAAAT TTTCACCTCA 
CCGACGCCCG ATAAAATCTT TGAATGCGCC ATGCAAGTTG ATGGCGGCGA AGGTGTACTG 
TTGATTATCA AAAATTACAC CGGCGATATT CTTAACTTTG AAACAGCGAC CGAGTTACTG 
CACGATAGCG GCGTAAAAGT GACCACTGTG GTCATTGATG ACGACGTTGC GGTAAAAGAC 
AGTCTTTATA CTGCCGGGCG ACGCGGCGTT GCCAACACCG TATTAATTGA AAAACTCGTA 
GGCGCAGCGG CGGAGCGTGG CGACTCACTG GACGCCTGTG CGGAACTGGG GCGTAAGCTG 
AATAATCAAG GCCACTCAAT AGGTATCGCT CTCGGTGCCT GTACCGTTCC TGCCGCGGGC 
AAACCTTCTT TTACCCTGGC GGATAATGAG ATGGAGTTTG GCGTCGGCAT TCATGGTGAG 
CCGGGTATTG ACCGCCGCCC CTTCTCTTCC CTTGATCAAA CCGTCGATGA AATGTTCGAC 
ACCCTGCTGG TAAATGGCTC ATACCATCGC ACTTTGCGTT TCTGGGATTA TCAACAAGGC 
AGTTGGCAGG AAGAACAACA AACCAAACAA CCGCTCCAGT CTGGCGATCG GGTGATTGCG 
CTGGTTAACA ATCTTGGCGC AACTCCGCTT TCTGAGCTGT ACGGCGTCTA TAACCGCCTG 
ACCACACGTT GCCAGCAAGC GGGATTGACT ATCGAACGTA ATTTAATTGG CGCGTACTGC 
ACCTCACTGG ATATGACCGG TTTCTCAATC ACCTTACTGA AAGTTGATGA CGAAACGCTG 
GCACTCTGGG ACGCCCCGGT CCACACCCCG GCCCTTAACT GGGGTAAATA A

Protein sequence

MKKLINDVQD VLDEQLAGLA KAHPSLTLHQ DPVYVTRADA PVAGKVALLS GGGSGHEPMH 
CGYIGQGMLS GACPGEIFTS PTPDKIFECA MQVDGGEGVL LIIKNYTGDI LNFETATELL 
HDSGVKVTTV VIDDDVAVKD SLYTAGRRGV ANTVLIEKLV GAAAERGDSL DACAELGRKL 
NNQGHSIGIA LGACTVPAAG KPSFTLADNE MEFGVGIHGE PGIDRRPFSS LDQTVDEMFD 
TLLVNGSYHR TLRFWDYQQG SWQEEQQTKQ PLQSGDRVIA LVNNLGATPL SELYGVYNRL 
TTRCQQAGLT IERNLIGAYC TSLDMTGFSI TLLKVDDETL ALWDAPVHTP ALNWGK