Gene Arth_0830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0830
Symbol
ID	4446668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	898954
End bp	899898
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	64%
IMG OID	639688637
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_830328
Protein GI	116669395
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.84032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGCGT TGAGCGCGTG TTCAAGCACC GGAGGAAAGC CCGCCGAGAC GGGTGGCGGC 
GCAGGTGGTG GCCAGGCCGC AAGCACGGAC CGCATCAAGG TGGCTCTCAT TACCCACGCG 
GCCGCGGGTG ATACCTTCTG GGACATCGTC CGCAAGGGTG CCGAGGAAGC GTCGGCGAAG 
GACAACGTTG AACTCCTCTA CACGTCCGAC CCCGAAGCCG GGCGTCAGGC TCAGCTCATC 
CAGCAGGCAA TAGATCAGAA GGTCGACGGC ATCGCGGTCA CGCTCGCCAA GCCCGAAGCC 
CTCAAAGATG TCCTGAAGAA GGCCGCCGAC GCGGGCATCC CGATTGTGAG CCTCAATGCC 
GGCGAGGGTG TCTCGGCGCA GCTGGGAGCG TTTACGCACT TCGGCTCCAA CGAGCAGCTC 
GCCGGTCAGG CCGTGGGCAC CAAGCTCGCC GCGGACGGAT TCAAGCATCC GATCTGCGTG 
ATACAGGAAC AGGGGCACGT CGGACTTGAA GCACGGTGCG CTGGTGTCAA GGCGAAGGTG 
CCCGGAACGG AGATCCTTTA CGTTGACGGC AAGGACATGA CCTCCGTCCA GTCCACCGCG 
ACCGCCAAGC TCCAGGCTTC CAAGGAGGCC GACGTCATCA TCGGCCTCGG GGCTCCCATC 
ACGCTGACGC TCCTCAAATC GGTCACTGAC GCGGGCAGTT CGGCCAAGGT GGCAAGTTTC 
GACCTGAACG CGGATCTCTC CCGGAAGATT GTGGATGGTG CAGTTCTGTT CACCGTGGAC 
CAGCAGCCGT GGCTGCAGGG ATACGGCGCA GTCGACGCGC TGTGGCAGAA CAAGCGCGGC 
GGCTTCAGTA TCGGTGGCGG CCAGCCCGTC CTGACCGGCC CCGCGATCGT CGACAAGTCA 
AATGCGGCCG ATGTCCTGAA GTTCGCCGAG CAGGGTATCC GCTAA

Protein sequence

MMALSACSST GGKPAETGGG AGGGQAASTD RIKVALITHA AAGDTFWDIV RKGAEEASAK 
DNVELLYTSD PEAGRQAQLI QQAIDQKVDG IAVTLAKPEA LKDVLKKAAD AGIPIVSLNA 
GEGVSAQLGA FTHFGSNEQL AGQAVGTKLA ADGFKHPICV IQEQGHVGLE ARCAGVKAKV 
PGTEILYVDG KDMTSVQSTA TAKLQASKEA DVIIGLGAPI TLTLLKSVTD AGSSAKVASF 
DLNADLSRKI VDGAVLFTVD QQPWLQGYGA VDALWQNKRG GFSIGGGQPV LTGPAIVDKS 
NAADVLKFAE QGIR