Gene Arth_1824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1824
Symbol
ID	4445653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2042898
End bp	2043854
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	61%
IMG OID	639689642
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_831314
Protein GI	116670381
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00471967
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAACAA CCCGCAAAAA CATGATTGCC AACGTCAGTG TTATCGCGGC CGTATGCGTG 
TTCGGATCGA TCGGACTCAC AGGATGCGCA ACGGCATCCG GCGCCGCCGG CGACCGCCCG 
ATGAAGATCG GAGTGACGGT CGCCAACAGC ACCAATCCCT TCTTCCAACA GGAATCCAAG 
ACCGCCGAAA GCTACGGCAA GTCGGTCGGC GCCGAGGTCC TCTCTCAGGT GGCCAATGAA 
GACGTGCAGA CCCAGTCGAA CCAGATCGAC CAGTTCATCA CTGCCGGGGT CAAATTCATC 
GTGATCGACG CCGCCGACAC CGACGGCGTC GGGCCGGCCG TCAAACGCGC CGTCAGTGCG 
GGCATCCCCG TCATCGGCGT TGACAACCAA TCCAAGAATG CCACCGTCAA CATCACCACC 
GACAACAAAC AGGCAGGCGA GATCTCGTGC CGTTCCCTGG CCGACAAGCT GGGCGGCAAA 
GGCAAAATAG CCATCCTGAA CGGTACGCCG GTGTCCGCCG TTGACGATCG CGTCACCGGC 
TGCAAAGGCA TTCTCGGTCA GTACCCCGAC ATCAAGATCG TGGCGGACCA GCGGGGTGAA 
AACAGCCGTG ACTCGGCATT GCCCATCGCC ACAGATATCC TGACCGCAAA CCCCGATCTT 
GACGGCTTCT TCGCTATCAA CGACCCGAGC GCCGTTGGTG TGCAGCTAGC GGCCGAACAG 
AAGGGCGCAT CGGTCGTCAT CACGTCGGTC GACGGTGCCA GCTCGGCCAC AGACGCGATC 
GCTGCCGGGG GTCTGATCAC CGCAACTGCT GCGCAGGACC CTGCAGCGCT CATGCGCCAG 
GCCATTGATC TTGGGATCTC GATCGTGAAC GGCAAGGAGC CTGATCAGAA AGTGATCCTC 
GTTCCGACGG AACTCGTCGA CGCCTCGAAT GTCGCCAAGT ACAAGCCGTG GGGCTGA

Protein sequence

MKTTRKNMIA NVSVIAAVCV FGSIGLTGCA TASGAAGDRP MKIGVTVANS TNPFFQQESK 
TAESYGKSVG AEVLSQVANE DVQTQSNQID QFITAGVKFI VIDAADTDGV GPAVKRAVSA 
GIPVIGVDNQ SKNATVNITT DNKQAGEISC RSLADKLGGK GKIAILNGTP VSAVDDRVTG 
CKGILGQYPD IKIVADQRGE NSRDSALPIA TDILTANPDL DGFFAINDPS AVGVQLAAEQ 
KGASVVITSV DGASSATDAI AAGGLITATA AQDPAALMRQ AIDLGISIVN GKEPDQKVIL 
VPTELVDASN VAKYKPWG