Gene Namu_4393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4393
Symbol
ID	8450019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4875114
End bp	4876109
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	66%
IMG OID	645043440
Product	dihydroxyacetone kinase, DhaK subunit
Protein accession	YP_003203669
Protein GI	258654513
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.838317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGT TCGTCAACGA CCCGAAGTCA TTCGTTCCGG AGATGTTGGA GGGACTGGCC 
CTGGCCAACC CCAACACGCT GCGGTACGAG CCCGAGTGGA ACCTGATCAT GCGGGCCGAC 
GCGCCGCGCG CGGACAAGGT CTCCATCGTC CAGGGGTCCG GATCCGGTCA CGAACCCGCA 
CACGTCATGG TGGTGGGCAA GGGCATGCTG GACGCCGCCT GTCCGGGGGA TGTCTTCGCC 
GCCCCGCCGA TGGACTACGT GTACGAGACG GCCAGACGAC TCGCCTCGCC CAAGGGCGTG 
CTGCTGCTGG TCAACAACTA CACCGGCGAC CGGATGGCCT TCGAGATGGG TAAGGAGATG 
GCCGAGTCCG ACGGGGTCAA GGTCGAGATC CTGATGATCA ACGACGACGT CGCGGTCAAG 
GACTCGCTGT ACACCATCGG CCGGCGCGGG GTGGCCGGGA ACTTCTTCGT CATCAAGGCG 
GTCGGTGCGG CCAGCGAACG CGGCGACAGC CTGGAGGAGG TCATCCGGAT CGGCAAGAAG 
GTCAACGACG TCACCCGGAC CATGGGCGTG GCGTTGACCG CCTGCACCCC GCCGGCCAAG 
GGCGAGCCGC TGTTCGAGAT GGCCGAGGAC GAGATGGAGG TCGGCGTCGG CATCCACGGC 
GAACCCGGCC GGGAACGGGT CAAGATCAAG ACGGCCGACG AGATCGTCGA CCTGCTGCTG 
GACGCCACCG TCAACGACCT GCCCTACCGG TCCGGCGACC GGGTGGCGCT GATGATCAAC 
GGGCTCGGCG GTACGCCGAT CAGCGAGCTG TACATCCTGT TCCGGCGGGC CCATCAGCAA 
CTCGCGGCCA AGGGCATCAC GGTCGCCCGC AGCTACGTCA ACGAGTACTG CACCTCCCTG 
GACATGGCCG GGGCGTCACT GACCCTGGTC CGGCTCGACG ACGAGATCGA GGAGTTGCTG 
GAGGCGCCGG CGGAGATCCC CAACCGGGTC TTCTGA

Protein sequence

MKKFVNDPKS FVPEMLEGLA LANPNTLRYE PEWNLIMRAD APRADKVSIV QGSGSGHEPA 
HVMVVGKGML DAACPGDVFA APPMDYVYET ARRLASPKGV LLLVNNYTGD RMAFEMGKEM 
AESDGVKVEI LMINDDVAVK DSLYTIGRRG VAGNFFVIKA VGAASERGDS LEEVIRIGKK 
VNDVTRTMGV ALTACTPPAK GEPLFEMAED EMEVGVGIHG EPGRERVKIK TADEIVDLLL 
DATVNDLPYR SGDRVALMIN GLGGTPISEL YILFRRAHQQ LAAKGITVAR SYVNEYCTSL 
DMAGASLTLV RLDDEIEELL EAPAEIPNRV F