Gene Arth_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3304
Symbol
ID	4443998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3708610
End bp	3710109
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	70%
IMG OID	639691128
Product	carbohydrate kinase, FGGY
Protein accession	YP_832780
Protein GI	116671847
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCCAG CACCGGACGG TGCATCAGCG GACACTGTCC CGGCCAACGC CGGGGCAGTG 
GCCGCCGGCA GTGTTTTCGC GGCCGTCGAC ATTGGCGCCT CTTCCGGACG GGTCATCCTC 
GGCCGTGTCT CCGGCGTCGC CGGTTCGGAA AGTGCCACGC TGGAGACGGT CCACCGCTTC 
CCGAACGGTG TGGTGGAGTC CGACGACGGT CTACGCTGGG ATTTCGACGC CCTCTTCGCC 
GAGGTACTCA CCGGCCTCGC TGCCGCGGCC CGCGTCGCCG GGGAGCGGGG CGAGGCCATC 
AGCAGCATCG GGATCGACAC CTGGGCGGTG GACTACGGCC TGGTGAACGC TGCCGGGGAG 
CTCATTGCGC AGCCCTTCAG CTACCGCGAT GACCGCAGCC GCGCCGCCGT CGCCCGGGTC 
CACCGGAAAC TGGACCCGGC CCGGCTCTAC GCCACCACCG GGCTGCAGTT CCTGCAGTTC 
AACACCCTCT ACCAGCTGGC CAGCGAACCG GACCTGGACG GTCTGCAGGC GCTGCTCATC 
CCGGACCTGA TCGCGTTCCT GCTCACGGGT CAGCGCCGCA CCGAGGCCAC CAACGCTTCC 
ACTACGGGGC TCTTTGATGC CGTCGCGGGG GAGTGGGCCA CCGAATTCCT TACGGCCCTC 
GGGCTCCCGA AGAACCTGTT CCCGCCGCTA ATCCAGCCCG GCGAAACCGT CGGTACCCTG 
CTGCCCGGCC TCGCCGCCCG CACCGGGCTG CACCAGGCCA CGAAGGTGGT GGCCGTCGGC 
TCGCACGACA CCGCCTCCGC CGTCGCCGCC GTGCCCGCCG AACACGGGAA CTTCGCCTAC 
ATCTCTTCAG GGACCTGGTC TCTGGTGGGC GTCGAACTCC GGAAGCCGGT GCTCACCGAG 
GCGAGCCGGC AGGCCAACTT CACCAACGAA CGCGGCGTGG ACGGCACCGT CCGCTACCTC 
CGCAACGTCG GCGGGCTCTG GCTGCTCAGC GAATGCCAGC GCACCTGGGC GCAGCAGGGA 
TATACGGCGA CGCTGGACGA CCTGCTGGCC GGCGCCGCCG CGCTGCCTTT CGGCGGACCC 
CAGATCAACG CCGACGATCC CTACTTCATC GCCCCGGACA ACATGCCCGA ACGCATCCAG 
GCCGCCGTCC GCAACACCGG CGACGTCCTC ACCGGCAACC CCGCGGCGAT CACCCGCTGC 
ATTCTGGACA GCCTCGCGGC CGGCTACGCC CGGACCATCG CCGACGCCGA ACGCCTGGCG 
GACGTGCCCG TCGACGTGGT CCACATCGTA GGCGGCGGCT CGCAAAACCG GCTCCTCTGC 
CAGCTCACCG CCGACGCCAC CGGCAAGCGC GTCATCGCGG GACCGGTCGA GGCCACCGCC 
TTGGGCAACG TCCTGATCCA GGCACGGGCG GCCGGTGTGG TGTCCGGAGG CCTGGCTGAC 
CTGAGGGCAC TGGTGCGCGG CTCGCAGCCA TTGGAAAACT ACCAGGCGGC GCTGGTCTGA

Protein sequence

MPPAPDGASA DTVPANAGAV AAGSVFAAVD IGASSGRVIL GRVSGVAGSE SATLETVHRF 
PNGVVESDDG LRWDFDALFA EVLTGLAAAA RVAGERGEAI SSIGIDTWAV DYGLVNAAGE 
LIAQPFSYRD DRSRAAVARV HRKLDPARLY ATTGLQFLQF NTLYQLASEP DLDGLQALLI 
PDLIAFLLTG QRRTEATNAS TTGLFDAVAG EWATEFLTAL GLPKNLFPPL IQPGETVGTL 
LPGLAARTGL HQATKVVAVG SHDTASAVAA VPAEHGNFAY ISSGTWSLVG VELRKPVLTE 
ASRQANFTNE RGVDGTVRYL RNVGGLWLLS ECQRTWAQQG YTATLDDLLA GAAALPFGGP 
QINADDPYFI APDNMPERIQ AAVRNTGDVL TGNPAAITRC ILDSLAAGYA RTIADAERLA 
DVPVDVVHIV GGGSQNRLLC QLTADATGKR VIAGPVEATA LGNVLIQARA AGVVSGGLAD 
LRALVRGSQP LENYQAALV