Gene Arth_1908 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1908
Symbol
ID	4445562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2148214
End bp	2149389
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	63%
IMG OID	639689718
Product	ROK family protein
Protein accession	YP_831390
Protein GI	116670457
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.477922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTTC CCCCTCGCGT TTCGGCGGGA GAGGTCTTCC AGCATTTTCG TGGCACGTCA 
CCGTTGACCC GGGCCCGGCT TTCAGCACTG ACAGGCCTTT CGCGGGCCGC AACGACAGAC 
AGGATGAGAA CCTTGGCGTC GCGGGGACTC ATTGGTCCCG CCAACGAGGC GCCATCGACG 
GGTGGCCGGC CATCCGCTCA GTTTCGCCTC ATGCCAAACA GCGGAGCGGT TATGAGCGTC 
CTGCTGGGTG CCAGCGAGGC AAAGGTGCAA GCATTCGACC TTTCCGGACA GCCGTTATCT 
GCTGCGAAGC CGGTGGAAAC CGTCCGTGGC GGGTATGCCG CTATCTTGGA TTCCTGCCTG 
GCTTCAGCGT ATTCGCTCCT GGATTCCATG GACGACATTT CCGGCCAGCT TGTAGCAACG 
GGGGTTGTTC TCGATGAAGG TGCGCCGGAT CTGGACTGGC CTGAATATTT TGCTGGCCGC 
CCGGTCGTCG TCGACTCCGC GCTGGGGGCC ATGGCAACCG CGGAGGCCCT GTCGCGAACC 
CCCCGGCCGC AAAACATGCT CTTCCTGGAC GTGGGAAAGA CCATTGGCTG TGCCGTGCTC 
GTCCACGGAA GGACGATGGG GGGTTTCAGG ACCTCCAAAG AGGCGTTCGG GCACACGCCG 
GGGAAGGGCA CGCCGACGCT GCCCTGTGCT TGCGGCATCA TGAATTGCCT GCAGGCCATC 
GCAGGGGAAG AGGCAATAAT TGCCGGTCTG TCGTCGGACC TTGCAGACGA ACCAGACGCG 
ATCAGCGGGG CTGTCCGGCG GAGCGATGCG GCTGCAGTCA GTGCTCTGCG ACAGGCAGGT 
CGGGACATAG GTGACACCCT GTTAGGGAGC ATTCACCTCC TTCAACCCGA GTTCATCACA 
GTCAGAACCC GGTGGCCCGG TGCCGCCGAC TTTTTGCTGG CCGGCCTTAG GGAGGCAATA 
TACGCAAGCG GCGTCCCTGC TGTGACGGAG AATCTGGTGT TGGCGAGTTC AACGACCGGG 
TCCCCCGCTA CCGGGATTGC TCTTCGAGCC CTGGACGCCG GACTGGCGGT GGAATCAGTG 
GACCGCTTGC TGTCAGCGCC ACCCAACCTC AGCGGACAGC GGAACTATTG GCCGGCACCG 
TTGAAGTCGA TCGACCGTCA ACGGCACGCC AGCTGA

Protein sequence

MTVPPRVSAG EVFQHFRGTS PLTRARLSAL TGLSRAATTD RMRTLASRGL IGPANEAPST 
GGRPSAQFRL MPNSGAVMSV LLGASEAKVQ AFDLSGQPLS AAKPVETVRG GYAAILDSCL 
ASAYSLLDSM DDISGQLVAT GVVLDEGAPD LDWPEYFAGR PVVVDSALGA MATAEALSRT 
PRPQNMLFLD VGKTIGCAVL VHGRTMGGFR TSKEAFGHTP GKGTPTLPCA CGIMNCLQAI 
AGEEAIIAGL SSDLADEPDA ISGAVRRSDA AAVSALRQAG RDIGDTLLGS IHLLQPEFIT 
VRTRWPGAAD FLLAGLREAI YASGVPAVTE NLVLASSTTG SPATGIALRA LDAGLAVESV 
DRLLSAPPNL SGQRNYWPAP LKSIDRQRHA S