Gene Arth_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1105
Symbol
ID	4446408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1198298
End bp	1199488
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	67%
IMG OID	639688911
Product	ROK family protein
Protein accession	YP_830599
Protein GI	116669666
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.348719
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTCAA CACCGCGCTC AACGAGGAGC CGAACCAAGA ACCCCGGGTC ACAGTCCGCT 
TTGAGGCACC TGAACCAGCA ACGGATCATC GAGTGCCTGC TGAACGGTCC GTCAACCCAG 
GCTGAACTCG CACGGCAGAC CGGCCTGTCC ACGGCAACGG TCTCCAACAT CGTCAAAATC 
ATGCAGGACG CCGGCCTGGC GTCCACGGAA CCGATCACCA GCTCCGGCCG CCGGGCCCTG 
AATGTCCGCC TCAACAGCAA CGGGGCAGTT GCCGTTGGCA TCGACTTCGG CCGCCGGCAC 
CTCCGGGTGG TCCTGGCGAC GCTGAGCTAC CACATCATCG CCGAGGAATC GGTGCTGCTG 
CCGCTGGGCC ACCACGCGGA CGAAGGCATC CGCGCCGCCG TCGAACTCCT CGCCAAGCTG 
CTGGACGAAA GCGGCGTGGA GCGCAGCGCC GTGGTGGGCG CCGGCGTCGG AATCCCCGGC 
CCTATCGACC GGCGGACGGG CACGGTGGCG CAAGGCGCGA TCCTCCCCGA GTGGGTGGGC 
ATCAACATCC TGCAGCACCT CGAGGACACC CTGAATTTCC CCGTCTTTGT TGACAACGAT 
GCCAATCTTG GCGCGCTGTC CGAGGTCACG TGGGGACCCC ACAGCGGCAT CAGCAACCTG 
ATGTTCCTGA AGATCGGCTC GGGCATTGGG GCCGGGCTGA TCCTCAACGG CGCCCCGTAC 
TACGGCAACG TGGGGATCAC CGGCGAAATA GGCCACGCCA CCATCCATGA ACACGGCCTC 
ATCTGCCGCT GCGGAAACCG GGGATGCCTG GAGACCATCG CCTCCACAAC CACCATGATC 
GAACTCCTGG GCCGGGGCGA GGAGAAGCCC CTCAGCGCCG AGGACATCGT CCGCAAGGCG 
CTGGAACGGG ACTCCGCCAC CCTAAGGGTC ATAGACGACG CAGGGCTGGC CGTGGGCCGC 
GCCCTGGGCA ACGTGGCCAA CCTCATCAAT CCGGAAGTGA TTGTGGTGGG CGGCCCGCTG 
GCCGGCCTGG GAGACCTGCT CCTGGACCCG ATCAGGCGGG GCCTGGTTCG GCATGCAGTG 
CCCGTGATCG GCGAGACCAC GACGCTCACC ATGTCCTCGC TCGGGGACCG CGCCGAGGCT 
CTCGGTGCGG CCGCGCTGGT CTTCCAGCAC GCGGGAATCC GGCGCTCCTG A

Protein sequence

MPSTPRSTRS RTKNPGSQSA LRHLNQQRII ECLLNGPSTQ AELARQTGLS TATVSNIVKI 
MQDAGLASTE PITSSGRRAL NVRLNSNGAV AVGIDFGRRH LRVVLATLSY HIIAEESVLL 
PLGHHADEGI RAAVELLAKL LDESGVERSA VVGAGVGIPG PIDRRTGTVA QGAILPEWVG 
INILQHLEDT LNFPVFVDND ANLGALSEVT WGPHSGISNL MFLKIGSGIG AGLILNGAPY 
YGNVGITGEI GHATIHEHGL ICRCGNRGCL ETIASTTTMI ELLGRGEEKP LSAEDIVRKA 
LERDSATLRV IDDAGLAVGR ALGNVANLIN PEVIVVGGPL AGLGDLLLDP IRRGLVRHAV 
PVIGETTTLT MSSLGDRAEA LGAAALVFQH AGIRRS