Gene Arth_2910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2910
Symbol
ID	4444432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3280490
End bp	3282004
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	72%
IMG OID	639690733
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_832389
Protein GI	116671456
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.899807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAGCG CCTACACCGG CACCCAGATT CGTGAGGCCG AAAAGCCCCT TCTTCTTTCC 
GGGGCAGGCG CTGTTCTGAT GCAGCGGGCC GCCTACGGCC TGGCCAACGC CGTTGTCCGT 
GAACTCGTTG CCCGGGGGAT CCGTCCCTAC GGGGCCAGCG TGGCGGTTCT TACCGGCAAA 
GGTAACAACG GGGGAGACGG GCTCTTCGCC GCGGCCTTCC TGGCCGCCCG GGGACTGCGT 
ACGACGGCGG TGCTCACCGC CGGTGAGGCC CACCCGGACG GGCTGGCCGC CTTTGAACGG 
GCCGGCGGGC GCGCCCGGAC CCTCACCGAC CACAACGCCG GTGAGCTGGC AGCGGCAGCC 
GCCAGCGCCG ACGTCGTGAT CGACGCGGTA CTGGGGACCG GAGCCCAAGG CGGGCTCCAC 
GGCGCCACGG CATCCCTCAT CGGGAAGCTG CGCGCCGCCG CCCACGGGTT TGTGGTGGCC 
TGCGACATTC CCAGCGGCGT GAACGCCGAC ACCGGCGAGG CCTATGATCC GGTCCTTCCG 
GCCGACCTCA CCGTGACGTT CGGCGGAGCG AAAGCCGGGC TGCTCGCCGA TCCCGGCGCC 
GACCATGCCG GGCGCGTCCT GGTCATCCCC ATCGGCATTG AAACCGAACT GCCGTCGCCG 
GTGCTGAGGC GCCTGGAATC CGCCGACCTT GCCCGGTTGC TGCCCCCGCC GACGCGCCGC 
TCCCACAAAT ACACCCGGGG CGTCCTGGGC GTCGTGGCGG GATCGCAACA GTATCCGGGA 
GCTGCCGTCC TCGCCTGCCG CGGCGCCCTC GCAGCGGGCG CCGGGATGGT CCGGTACCTT 
GGCCCGCCCG AGCCGACCCG CCTGGTGCGC CAGGCCTGCC CGGAGGTGGT GTGCGGACCG 
GACAACGTGG CAGACGCGCA CGTCCAGGCG TGGCTGGTCG GTTCAGGGAT CGCCGAAGGC 
GACCGCGAAC AGCTGCAGCG GGTCCGCGAC GCCGTGGAGA CGGGACTGCC AGTGGCCGCC 
GACGCCGGTG CGCTGCCTGC CCTTCCTGAT GCCCTGCCTC CGCACGTGGT GCTGACACCG 
CACGGCGGCG AGCTGGCGCG CGTCCTGCAG CGGTACGGGA TCGACCTGGG CCGGCAGGGA 
GTTGACGGTG CCACCCTCGA CGCCGTGCGC CAGGCGGCTG AAAGGACCGG AGCCACAGTC 
CTGCTCAAGG GCGCCACCAC GCTGGTGGCT GCGCCGTACG GCCCCGTTTT CAGCCAGGCT 
GAAGCCACGC CGTGGATGGC AACTGCCGGA AGCGGTGACG TGCTGGCCGG GGTGCTCGGG 
TCCCTGCTGG CCCAGCATTC GGATGACGAG GAAAGATTTG CGGCCTGCGG GATCTCCGCG 
GACCAGCGCT GGGCGGCCAT CGGCGCCATG GCGGCGAGCC TGCACGGCCG CGCAGGGACC 
CTTGCCTCAG CCGGCGGCCC CGTGACCGCC GGTGCCATCG CTCAATCCCT GCCCGAGGTG 
ATGCGGACCT TGTAA

Protein sequence

MISAYTGTQI REAEKPLLLS GAGAVLMQRA AYGLANAVVR ELVARGIRPY GASVAVLTGK 
GNNGGDGLFA AAFLAARGLR TTAVLTAGEA HPDGLAAFER AGGRARTLTD HNAGELAAAA 
ASADVVIDAV LGTGAQGGLH GATASLIGKL RAAAHGFVVA CDIPSGVNAD TGEAYDPVLP 
ADLTVTFGGA KAGLLADPGA DHAGRVLVIP IGIETELPSP VLRRLESADL ARLLPPPTRR 
SHKYTRGVLG VVAGSQQYPG AAVLACRGAL AAGAGMVRYL GPPEPTRLVR QACPEVVCGP 
DNVADAHVQA WLVGSGIAEG DREQLQRVRD AVETGLPVAA DAGALPALPD ALPPHVVLTP 
HGGELARVLQ RYGIDLGRQG VDGATLDAVR QAAERTGATV LLKGATTLVA APYGPVFSQA 
EATPWMATAG SGDVLAGVLG SLLAQHSDDE ERFAACGISA DQRWAAIGAM AASLHGRAGT 
LASAGGPVTA GAIAQSLPEV MRTL