Gene Rsph17025_0794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0794
Symbol
ID	5083485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	808418
End bp	809425
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	68%
IMG OID	640482352
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001167005
Protein GI	146276846
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGA CCTTTCGCAG CCTCGGACGC GGGCTTGCCA TCGCGGGCGT GGCGCTGGCC 
GCGGCGCTTG GCGCGCCAGC CGGGGCCGAG ACACTGCTGA ACGTGAGCTA CGACCCGACG 
CGCGAGCTTT ACCGCGACGT GAACGAGGCT TTCGCGAAAC ACTGGCAATC GCAGGGCAAC 
CCGGCCCCGA CGCTCGAGTC CAGCCATGGC GGCTCGGGCG CGCAGGCCCG CGCGGTGATC 
GACGGGCTGA ACGCGCAGGT GGTGACGCTG GCGCTCGCCT CGGACATCGA CGCGATTGCG 
GCGAAGTCGG GCAGGATCCC GGCCGACTGG CAGGCGAAGC GCCCGCACAA CTCCTCGCCC 
TATACCTCGA CCATCGTTTT CCTGGTGCGC GAGGGCAATC CGAAGGGCAT CGGGGACTGG 
GGCGACCTGG TGAAGGAGGG CGTGCAGGTC ATCACGCCCA ACCCCAAGAC CAGCGGAGGC 
GCGCGCTGGA ACTATCTGGC CGCCTGGGCC TGGGCCGAGA AGAACGGCCA GGATCCGAAG 
GCCTTCCTGC ACGACCTTTT TGCCAATGTG CCTGTGCTCG ACACCGGCGC GCGCGGCGCC 
ACCACGACCT TCGCGCAGCG GGGTCTTGGC GATGTGCTGC TGGCCTGGGA GAACGAGGCC 
TGGCTCGCGC TTGAGGAACT GGGCGAGGAC CGCTTCGACA TCGTCGTCCC CTCGGTCTCG 
GTGCTGGCCG AGCCGCCGGT GACGGTGGTC GAGGGCAACA TCGCCTCGGA GGCGCAGCGC 
GAGCTGGCGA ATGCCTATCT CGACTTCCTC TACACGCCCG AGGGCCAGGC GCTCGCCTTC 
AAGCACTACT ACCGCGCCTG GGATGCGTCA AAAGCCGATC CGGCCGACGT GAAGCGCTTC 
CCCGAGCTGG AACTGGTCGA CATCGGCCAC TTCGGCGGCT GGGCCAAGGC GCAGCCCGAA 
CATTTCGGCG ACGGCGGCAT CTTCGACCAG ATCTACGAGG CGAAGTGA

Protein sequence

MTQTFRSLGR GLAIAGVALA AALGAPAGAE TLLNVSYDPT RELYRDVNEA FAKHWQSQGN 
PAPTLESSHG GSGAQARAVI DGLNAQVVTL ALASDIDAIA AKSGRIPADW QAKRPHNSSP 
YTSTIVFLVR EGNPKGIGDW GDLVKEGVQV ITPNPKTSGG ARWNYLAAWA WAEKNGQDPK 
AFLHDLFANV PVLDTGARGA TTTFAQRGLG DVLLAWENEA WLALEELGED RFDIVVPSVS 
VLAEPPVTVV EGNIASEAQR ELANAYLDFL YTPEGQALAF KHYYRAWDAS KADPADVKRF 
PELELVDIGH FGGWAKAQPE HFGDGGIFDQ IYEAK