Gene Arth_0172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0172
Symbol
ID	4447365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	177435
End bp	178436
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	65%
IMG OID	639687967
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_829673
Protein GI	116668740
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGC TGATCAACGA TCCCCGCGCT GTAGTAGACG AGTCCGTGGA AGGCTTCGGC 
CTTGCGCATG CGGACATTGT GACCGTCAGC GCCGAGCCGA AGTTCATTAC CCGCAAGGAC 
GCCCCCGTGG CCGGGAAAGT GGGCCTTGTC AGCGGCGGCG GCAGCGGCCA TGAACCGCTT 
CACGGCGGCT TCGTCGGGCT GGGAATGCTC GACGCCGCCG TGCCGGGGGC CGTCTTCACC 
TCGCCCACCC CTGATCAGAT CATTCCTGCG ACCCTCGCCG TAAACTCGGG TGCCGGCGTC 
GTCCACATCG TCAAGAACTA CACCGGCGAC GTCCTGAATT TCGAAACGGC CGCCGAAATG 
GCGGAAGCCG AAGGCGTGCA GGTCCGCACC GTACTGGTCA ACGACGACGT CGCCGTGGAG 
GACTCGCTGT ACACGGCGGG CCGGCGCGGC GTAGGCGGAA CTGTCCTGGT GGAGAAGATC 
GCCGGTGCGG CAGCGGAACG CGGGGATGAC CTGGATGCCG TCGCCGCCAT TGGGGACCGG 
GTCAACCAAA ACGTCCGCAG CATGGGCGTC GCGCTATCCG CCTGCACGGT CCCGCACGCA 
GGGGTGCCCA GCTTTGACCT GGAAGAGAAC GAAATCGAAA TCGGCATCGG GATCCACGGC 
GAGCCCGGAC GGCACCGGAT CCCCATGGAA AATGCCGACG GCATCACCGA CCGCCTCCTG 
GAGCCCATCC TGTCCGACCT GGGCATTGCC TCCGGCGAGA AAGTGCTCCT GTTCGTGAAC 
GGCATGGGCG GGACGCCGCA AAGCGAGCTC TACATCGTGT ACCGCCGTGC AGCGCAGGTT 
CTCGCGGAGA AAGGCGTCAC GGTGGAGCGC TCCCTGGTGG GCAACTACAT CACCTCACTG 
GAGATGCAGG GCTGCTCCAT CACTGTTCTT CGGCTCGACG ACGAACTGAC CAGCCTCTGG 
GACGCCCCGG TCCACACTGC CGCGCTGCGC TGGGGCATCT GA

Protein sequence

MKKLINDPRA VVDESVEGFG LAHADIVTVS AEPKFITRKD APVAGKVGLV SGGGSGHEPL 
HGGFVGLGML DAAVPGAVFT SPTPDQIIPA TLAVNSGAGV VHIVKNYTGD VLNFETAAEM 
AEAEGVQVRT VLVNDDVAVE DSLYTAGRRG VGGTVLVEKI AGAAAERGDD LDAVAAIGDR 
VNQNVRSMGV ALSACTVPHA GVPSFDLEEN EIEIGIGIHG EPGRHRIPME NADGITDRLL 
EPILSDLGIA SGEKVLLFVN GMGGTPQSEL YIVYRRAAQV LAEKGVTVER SLVGNYITSL 
EMQGCSITVL RLDDELTSLW DAPVHTAALR WGI