Gene RSP_3701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3701
Symbol
ID	3722191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	+
Start bp	822302
End bp	823351
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	640073375
Product	ABC sugar transporter, periplasmic binding protein
Protein accession	YP_355212
Protein GI	77465709
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGCA GAACCTTCGC CCTGGCTGCG GCCTCGGGCC TCGTGGCCGC CCTTTTCGGC 
GCCGCCGCTT CCGCGCAGGA GGCCGCCACC GTGGCCTTCC TGATGCCCGA CCAGGCATCC 
ACCCGCTACG AGGAGCACGA CTTCCCCGGC TTCCAGAAGT CGATGGGCGA GCTCTGCGCC 
GACTGCACGG TGATCTACCA GAACGCCAAC GGCGACGTGG CGCTCCAGCA GCAGCAGTTC 
AACTCGGTGA TCGCGCAGGG CGCCAAGATC GTCGTGCTCG ATCCGGTCGA TTCGGCCGCC 
GCCGCCTCGA TGGTCGAGAT CGCCCATTCG CAGGATGTGA AGGTGATCGC CTATGACCGG 
CCGATCCCGG CCACGCCCGC GGATTACTAC GTCTCCTTCG ATAACAAGGG CATCGGCCAG 
GCCATCGCCC AGTCGCTCGT CGATCATCTG AAGGCCACCG GCGTGCCGGA CGGCGCGGGC 
GTCCTGCAGA TCAACGGCTC GCCCACCGAT GCGGCCGCGG GCCTCATTCG CGACGGGATC 
GACGCGGCGC TCGACGCATC GAGCTACAAG ACGCTGGCCG AGTTCGACAC GCCGGACTGG 
GCCCCGCCGA AGGCGCAGGA ATGGGCCGCG GGCCAGATCA CCCGCTTCGG CGACGAGATC 
AAGGGCGTGG TCGCGGCCAA TGACGGCACC GCCGGCGGCG CCATCGCGGC CTTCAAGGCG 
GCGGGCGTGG ATCCGGTTCC GCCGGTCACC GGCAACGACG CCACCATCGC GGCGCTGCAG 
CTCATCATCT CGGGCGACCA GTACAACACC ATCTCGAAAC CCTCCGAGAT CGTGGCCGAG 
GCCGCGGCGA AGGTGGTCGT GACCTTCCTC AAGGGCGAGA CCCCCGAGGC CAAGACCACG 
CTCTACGACA CGCCGGCCGA GCTCTTCGTG CCTGCGGTGG TGACGGCCGA GAACATCAAG 
GCCGAGATCT TCGACAAGGG CATCCAGACC GCGGCGGAAG TCTGCACCGG CGAATATGCC 
GAAGGCTGCG CCAAGCTCGG CATCCAGTGA

Protein sequence

MTSRTFALAA ASGLVAALFG AAASAQEAAT VAFLMPDQAS TRYEEHDFPG FQKSMGELCA 
DCTVIYQNAN GDVALQQQQF NSVIAQGAKI VVLDPVDSAA AASMVEIAHS QDVKVIAYDR 
PIPATPADYY VSFDNKGIGQ AIAQSLVDHL KATGVPDGAG VLQINGSPTD AAAGLIRDGI 
DAALDASSYK TLAEFDTPDW APPKAQEWAA GQITRFGDEI KGVVAANDGT AGGAIAAFKA 
AGVDPVPPVT GNDATIAALQ LIISGDQYNT ISKPSEIVAE AAAKVVVTFL KGETPEAKTT 
LYDTPAELFV PAVVTAENIK AEIFDKGIQT AAEVCTGEYA EGCAKLGIQ