Gene Arth_2429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2429
Symbol
ID	4445031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2723614
End bp	2724870
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	69%
IMG OID	639690242
Product	ROK family protein
Protein accession	YP_831908
Protein GI	116670975
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACGGG AAGATAATGC CAACGGCCGT GCAGGCGGTT CCTTCAAAGA ACCGGGTCCG 
GCACCCGGCC GGGTGGAGGA CGTCCGGCGC GGGAACCTCG TGCGGGTCCT CGCGGCAATT 
GCGCAGGCAC GGACGGATCC ACAGCGCTAC CCTACGCGCG CCGAGCTGGC CTCCCTGACG 
GGCTTGACCA AGGCCTCAGT GTCCAGCCTG GTCGCGGAGC TCGCGGACTC CGGCCTGGTC 
ATGGAGTCCG GCGCCACGCG CGACGGTGAA CGCGGCCGGC CCGGGGTAGG CCTTCAGCTG 
AGCACCCGCC GCGGCGTGGT GGGCATGGAA ATCAACGTGG ACTACATCTC GGCAGGCCTT 
CTGGACCTCG GCGGTGCGCT GCGTGCTTCC AGGACGCTGG AGTGCGGAAA CCGCGGCCAG 
TCGCCTGAAT CCGTTATGGC CCTGTTGTCC GGGCTCGTGA ACGGCGTCGT TGCCGAGGCG 
GCAGCCGCCG GGATCGAAAT CCTGGGCGGC GGACTGGCGG TGCCCGGCCT CGTGGATACG 
GCCTCCGGAA CTGTTTCCAG CGCCCCCAAC CTGCAGTGGC ACAGTGTTGC CCTTGAACTG 
GGCGGGCTGC TGCCGGGCGC ACCGCTGGGC ACTGTTCTGT ATAACGAGGC TAACTGCGCC 
GCCCTGGCCG AGCTCTGGTA CGGGCACGGA CTGGATTTCC GCGACTACCT GTTTGTTTCC 
GGTGAGGTGG GTGTCGGTGG CGGCCTGGTC ATCGGCTCCC GGCTCTTCGC CGGACCCCAC 
GGACAGGCGG GGGAGGTAGG CCACGTTGTG GTTGACCCCT CGGGTCCGGA CTGCTCGTGC 
GGCGGCCGCG GCTGCCTGGA AACGTTCGCC GGCCAGGAGG CCATCTTTGC CGAGGCCGGC 
ATTCCGGCAG GCACTGCCTC CGTGCGGCTG GGGCAACTCG TGGAACAACT TGACGCCGGC 
AATGCAGCCG CCACATCTGC CGTGGCCCGC GCGGGCCGCT ACCTTGGCAT CGCCGCAGCA 
TCCACGGCAC GGCTGATGAA CCTCTCCGCC GTTGTCCTCG GCGGCCACTT CACCCGGATG 
GGGCCGTGGC TTGCACCGGC CGTGATAGAA AGCCTCGCCA ACCATGCGCC CGGCGTCGTC 
AGTCCCGCCA GGGTGGCGGT TTCGGAGCTT GGCCAGTCGG CTGCCCTCCT GGGCGCGGCA 
GGGAGCGCCC TGCGTTCCGT CCTTGCCGCT CCCTCCGCGC TGACGCCCGC CGGTTAG

Protein sequence

MSREDNANGR AGGSFKEPGP APGRVEDVRR GNLVRVLAAI AQARTDPQRY PTRAELASLT 
GLTKASVSSL VAELADSGLV MESGATRDGE RGRPGVGLQL STRRGVVGME INVDYISAGL 
LDLGGALRAS RTLECGNRGQ SPESVMALLS GLVNGVVAEA AAAGIEILGG GLAVPGLVDT 
ASGTVSSAPN LQWHSVALEL GGLLPGAPLG TVLYNEANCA ALAELWYGHG LDFRDYLFVS 
GEVGVGGGLV IGSRLFAGPH GQAGEVGHVV VDPSGPDCSC GGRGCLETFA GQEAIFAEAG 
IPAGTASVRL GQLVEQLDAG NAAATSAVAR AGRYLGIAAA STARLMNLSA VVLGGHFTRM 
GPWLAPAVIE SLANHAPGVV SPARVAVSEL GQSAALLGAA GSALRSVLAA PSALTPAG