Gene Rsph17025_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0234
Symbol
ID	5083782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	227543
End bp	228580
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	640481789
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001166449
Protein GI	146276290
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.594018
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGAGGAG ACATCGTGAC ACGACTCAAG ATCGCCCTGA TGGGGTGTGC GGGGGCGCTT 
GCCCTGTCGG CCGCTCCGGC CCTGGCCCAG GAGGTCGGCG CCTGCCTGAT CACCAAGACC 
GACACAAACC CGTTCTTCGT GAAGATGAAG GAAGGGGCCA CGGCGAAGGC ACAGGAACTC 
GGCATCAACC TCAAGTCCTA CGCGGGCCGG ATCGACGGCG ACAGCGAAAG CCAGGTGGCC 
GCCATCGAGA CCTGCATCGC CGACGGGGCG AAGGGCATCC TGCTGACGCC GTCCGACACC 
AAGGGGATCG TGCCGTCGGT GCAGAAGGCG CGCGACGCGG GCATCCTCGT GATCGCGCTC 
GACACGCCGC TGGATCCGAT CGACGCGGCC GACGGCACCT TCGCCACCGA CAACTTCCTC 
GCGGGCGAGC TGATCGGCCA GTGGGCGCAG GCCAAGATGG GCGATGCGGC AGCGGATGCG 
CGGATCGCGA TGCTGAACCT CGGCGTGTCG CAGCCCTCGG TGGATGTGCT GCGCGCGCAG 
GGCTTCCTGC AGGGCTTCGG CGTCGATCTC GGCGACCCGA ACCGCTGGGG CGACGAGACC 
GACCCGCGCA TCGTCGGCCA TGACGTGACC GACGGCAACG AGGAGGGCGG GCGCCGCGCG 
ATGGAGAGCC TTCTGGCGCA GGATCCGATG ATCAACCTCG TCTATACGAT CAATGAGCCG 
GCGGCGGCCG GCGCCTACGA GGCGCTGCGC TCCATCGGAC GCGAGAGCGA CGTGCTGATC 
GTCTCGATCG ACGGCGGCTG CCCGGGCGTC CAGAACGTGA AGGAGGGGGT GATCGGCGCC 
ACCTCGCAGC AATATCCGCT GCAGATGGCG GCGCTGGGGG TCGAGGCCAT TGCGGCCTTT 
GCCAAGGACG GCACCCGGCC CGCGACGACC GAGGGCAAGG ACTTCACCGA CACGGGCGTG 
GCGCTTGTGA CCGACCAGCC GGTCGAGGGG GTGGAGTCGA TCGACAGCGC CCGCGGCGCG 
GAACTCTGCT GGGGCTGA

Protein sequence

MGGDIVTRLK IALMGCAGAL ALSAAPALAQ EVGACLITKT DTNPFFVKMK EGATAKAQEL 
GINLKSYAGR IDGDSESQVA AIETCIADGA KGILLTPSDT KGIVPSVQKA RDAGILVIAL 
DTPLDPIDAA DGTFATDNFL AGELIGQWAQ AKMGDAAADA RIAMLNLGVS QPSVDVLRAQ 
GFLQGFGVDL GDPNRWGDET DPRIVGHDVT DGNEEGGRRA MESLLAQDPM INLVYTINEP 
AAAGAYEALR SIGRESDVLI VSIDGGCPGV QNVKEGVIGA TSQQYPLQMA ALGVEAIAAF 
AKDGTRPATT EGKDFTDTGV ALVTDQPVEG VESIDSARGA ELCWG