Gene RSP_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4037
Symbol
ID	3711799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007488
Strand	+
Start bp	3642
End bp	4931
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	68%
IMG OID	640069302
Product	ABC sugar transporter, periplasmic lignad binding protein
Protein accession	YP_345169
Protein GI	77404595
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0204263
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACAGT TCATCATCGG CGCCGCCGTG GCGCTCGTTG CCGTGCCGGC CGCAGCGCAG 
GAGTTCGACT GGCGCAAGCA CGAGGGCGAG ACGATCAACG TCATGCTGAA CAACCTCGCC 
TGGACGCAGC TGATGCGCGA CCGGATCGAG GCCTTCACCG AGGCCACCGG CATCAGGGTG 
CGCGCCGAGA CCTTCAGCGA AGAGCAGTAC CGCACCCGCC TGACCACGCT TCTTCAGGGC 
GGCTCGAGCG AGCTCGACGT CTTCATGACC CTGCCCTCGC GCGAGGCGCC GCTCTTCGCC 
TCGAACGGCT GGTATGCCGA TCTCGCGCCG CTCCTGAAGG GCGAGGCGAC CGATCCGGCC 
TACGATTACG ACGATTTCAG CGCGGCCCTG CGCCAGAGCG GCGTGGTGGG CGAGACCATC 
ACCAGCGTGC CGATCAACGT CGAGGGCCCG CTCTTCTACT GGCGCCGCGA CATCTTCGAG 
AAATGCAACG TCGAGAAGCC CGAATATCTC GAGGATCTGC CCGCCGCGGC CGAGAAGATC 
CGCGCCTGCG ACAGCGCGAT CACGCCCTGG GCCGCCCGCG GCCTGCGCGG CACCGTGGGC 
TACCCGCTCG GCGCCTTCGT CTACAACATG GGCGGCGACT TCATGGATGC GGACGGCAAG 
GCCTCGCTCT GCCTGCCGGG CACGATCAAG GGCCTCGACC TCTACGGCTC GATGCTGCGC 
GACTACGGCC CGCCGGGCGC CACCAACCAC ACCTTCACGC AGGTGATGGA CCTGCTGGGT 
CAGGGCCGCG TCGCCATGAC CAACGAATCC TCGAACGAAT TCTCGACCCT GATGAAGCAT 
GAGGGCCGGG CCGAGGACAT CGGCGTGGAT GTGCTGCCCG GCGGGCGCGA GTCCGGCACC 
TCGAAACCCG TGGTCATCAA CTGGAGCCTC GCCGTCTCGG GCCTCTCCGA GAACAAGGAA 
GCCGCCTGGT ATTTCGTCCA GTGGGCCACC GGCGCCGAGA ACCAGGAGGC GCTCGCCACG 
CAGGGCATCG CCCCCTCGCG CGTCTCGGTC TTCAACGGCG AAGGCTTCCG CAACTGGGCC 
AGCGAAAGCC GCCCGCGCGG CGAATGGCTC GAGGCGCTGC TCGAGATCTC GCAGACCGGC 
TCCTCGCTCT ACCAGACCCC CTCGCTGACC CGGACGCCCG AGGCGCGCGA GATCCTGTCG 
AACGTGGTGC AGCAGATCGT GCTGGGCCAG ACCGACGCCG AAACCGCCGC CTGCGCCGTG 
ACCGACGAGG TCCAGGCCCT GCAGAACTGA

Protein sequence

MRQFIIGAAV ALVAVPAAAQ EFDWRKHEGE TINVMLNNLA WTQLMRDRIE AFTEATGIRV 
RAETFSEEQY RTRLTTLLQG GSSELDVFMT LPSREAPLFA SNGWYADLAP LLKGEATDPA 
YDYDDFSAAL RQSGVVGETI TSVPINVEGP LFYWRRDIFE KCNVEKPEYL EDLPAAAEKI 
RACDSAITPW AARGLRGTVG YPLGAFVYNM GGDFMDADGK ASLCLPGTIK GLDLYGSMLR 
DYGPPGATNH TFTQVMDLLG QGRVAMTNES SNEFSTLMKH EGRAEDIGVD VLPGGRESGT 
SKPVVINWSL AVSGLSENKE AAWYFVQWAT GAENQEALAT QGIAPSRVSV FNGEGFRNWA 
SESRPRGEWL EALLEISQTG SSLYQTPSLT RTPEAREILS NVVQQIVLGQ TDAETAACAV 
TDEVQALQN