Gene Arth_1715 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1715
Symbol
ID	4445754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1916057
End bp	1917334
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	639689537
Product	ROK family protein
Protein accession	YP_831209
Protein GI	116670276
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.853629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTCCT TATGGTTTCT GTTGCCCGGC TCGCGAGTCG GTCAGGCACT CACCCTCATG 
GGCCTGTCGG TGACGGACTA TGATTCAGAG ATGCCCGACG CCACCGAACC AGGAACCACG 
GAACGATCGC TTGTCGAGCT CCTGCTGGCC GAAGGTCCGT CCACCCGCCT GGAACTTCAA 
GCCAAGCTGG GGGTTTCGCG CCCGACCCTT TCGTCTGCTG TGAACAAACT GTTGAGCCTG 
GGACTTCTCC AGGAACAGGG AACGGCAGCA TACGGTGCCG GAAGAAACGG CCGCCCCCAA 
GCATTGCTCG CGCCGAACAG GGCTATGGGA GCGGCGGTAG GTATCGAACT GGGCAAAGCT 
CAGGTTGCGG TCACTATCCT CGCGATCGAC GGGACGGTTC ACGCCCAAAA GGTCACCTCG 
ACGTCACCGG GGACGACGCT GCAGCGACGG CTCAATATCG CGCTGGGCTC CGTCGGCACT 
TTCATCAGCT CCAATATTCT CAACCCCGAG TCTGTTCTGG GTGTGGGCGT GGGGGTATCC 
GGCCTTCATC CCGATGCCCG GCCGGCCGGT GGCTCCGCTC TCGTTGATCC GCCCGGCGCG 
AAGCTTGACA AGCTGAGAAC ACTCCTTGCC GCCCCGGTCG TCTGGGACAA CAACACCCGG 
ATGGCCACCT TTCGCCACCT TGGCGGTTCC GGGCTCGACT CCCCCGGTGC CGTTCTCTAT 
GTTGTCCTTT CCGCTGGGGT CAGCGCGGGC ATTGTGGACG GCGGGGAGGT CCTTCGAGGC 
CGAGGCGCCG CCGGTGAGCT GGGGCATGTC TGCCTCGACC CCGAAGGCCC CGTATGCGGG 
TGCGGTTCAA GGGGGTGTCT CGAGGCCTAC GTGGGCGTGG AGGCCGTCCT CCGGTCGGCC 
CGGGGCAAGG GTGCCACTGT CGCAGACCTC GAGGAACTGG CCGCCGTTGT CCAGTCAGGT 
GATGCCGATG CGCTGGCCGT GATCGGGCTA GTTGGTCGGA TGCTTGGCAT CGGTCTTAAC 
AATGCTGCGA TGTTGGTCGA CCCTCGCCGC ATCATTCTCA CGGGTCCTCT CCTTAGCCTG 
GGTCCGGCGC TGGTCTCGGC GGCCACGGAG GAACTACGGA TCCGGCGAAT GGCGGTCACT 
TTAGGGGTAC CCGACGTCGT GGCCGAGATC GGGTCGCCTT TCGACTCCAG CCACGGTGCC 
GCGCTGACGG CGCTTAGGCG GTGGGGCCCC GGTTTCATGG GAATGCTGAC GCAAAATGGG 
ATAGCCACGA CGGGCTAA

Protein sequence

MPSLWFLLPG SRVGQALTLM GLSVTDYDSE MPDATEPGTT ERSLVELLLA EGPSTRLELQ 
AKLGVSRPTL SSAVNKLLSL GLLQEQGTAA YGAGRNGRPQ ALLAPNRAMG AAVGIELGKA 
QVAVTILAID GTVHAQKVTS TSPGTTLQRR LNIALGSVGT FISSNILNPE SVLGVGVGVS 
GLHPDARPAG GSALVDPPGA KLDKLRTLLA APVVWDNNTR MATFRHLGGS GLDSPGAVLY 
VVLSAGVSAG IVDGGEVLRG RGAAGELGHV CLDPEGPVCG CGSRGCLEAY VGVEAVLRSA 
RGKGATVADL EELAAVVQSG DADALAVIGL VGRMLGIGLN NAAMLVDPRR IILTGPLLSL 
GPALVSAATE ELRIRRMAVT LGVPDVVAEI GSPFDSSHGA ALTALRRWGP GFMGMLTQNG 
IATTG