Gene Rsph17025_2890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2890
Symbol
ID	5083238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2945202
End bp	2946791
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	66%
IMG OID	640484460
Product	extracellular solute-binding protein
Protein accession	YP_001169081
Protein GI	146278922
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.271762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGCT TGCCGCTCCG CACCGGGGCC TGTCTTCTCG CGATGATCGT TGCAGGCGCC 
GGCGCTGCCG CCGCGCAGGT GACCCTTGTC CGGGGCAACG ACACCGATCC CGCGACGCTC 
GACCATCACC TGACCTCGAC CGTGGCCGAG AGCCGGATCC TGAACGATCT CTACGAGGGG 
CTCGTGGTGC AGGATGCGCG GGGCGAGGTG GTGCCGGGGG TGGCCGAGAG CTGGGAGATC 
TCGGAGGATG GTCTGACCTA CAGCTTCAAG CTGCGCGACG ATGCGAAATG GTCGAATGGC 
GATCCGGTGG TGGCCGGAGA CTTCGTCTTC GCGCTGCGCC GGATCGTGAC GCCCGCGACG 
GCGGCGGTCT ATGCCAACAT CCTCTACCCG ATCCTGAACG CCGAAGCCGT CGCCTCGGGC 
CAGATGACCC CGGAAGAGCT GGGGGTCGAG GCGGTGGATG ATCATACGCT GCAAATCACC 
CTGAACGCGC CCACCCCCTA CTTCCTCGAA CTGCTCACGC ACCAGTCCTC GCTGCCGCTG 
CACCCGGCGA CGGTCGAGGC GGAAGGCGCG AACTTCACGC GGCCCGGCGT GATGGTCACG 
AACGGCGCCT ACAAGCTGGT CAGCTTCGTG CCGAACGACC GCATCGTCAT GGAGAAGAAT 
GAGCATTTCC ACGGCGCGCA GGACATCGCC GTCGATCGCG TCGAATGGGT GCCCTTCGAG 
GATCGCTCGG CCTGCCTGCG GCGCTTCGAG GCGCAGGAGG TGCAGATCTG CACCGACGTG 
CCCGCCGAAC AGATGAGCTA CATGCGCCAG AACCTCGGCG AGCAGCTGCG CATCGCGCCC 
TACCTCGGCA CCTACTACCT GCCGGTGAAG GGCGCCGACG GCAGCCCGCT CAAGGACAAG 
CGCGTGCGTC AGGCGATCTC GCTCGTGCTC GACCGCGACT TCATCGCCGA GCAGGTCTGG 
CAGGAGACGA TGCTGCCCGG CTACTCGATC GTCCCGCCGG GCATCTCGAA CTATGTCGAG 
ACGCCCCCCT CGCTCGATTA TGCCGAAGAG GATCTGCTTG ACCGCGAGGA CCGGGCCAAG 
GCGCTCCTTG AGGAAGCGGG CGTGGCCGAG GGCAGCCTGA CCGTGCAGCT CTCCTACAAC 
TCGTCCGAGA ACCATCGCAA TACGATGACC GCCATCGCCG ACATGCTGAA GAACATCGGC 
ATCAACGCGA CGCTGAACGA GATGGAGGGG ACGAACTACT TCAACTACCT CAAGGAAGGC 
GGCGCCTTCG ACATCGTGCG CGCGGGCTGG ATCGGCGACT ATTCCGACCC GCAGAACTTC 
CTGTTCCTGT TCGAGGGCGG CGTGCCCTTC AACTATCCGC GCTGGGAGAA CGCCGATTAC 
GACGCGCTGA TGGACAGGGC CGCCCAGACC CAGGATCTCG ACGAGCGGGC ACAGATCATG 
GCCGAGGCCG AGACGATCCT GCTCGACGAG GTGCCGGCGA TCCCGCTGCT CACCTACTCC 
TCGCGCGCGC TCGTTTCGGA CCGGGTGCAG GGCTACGAGG ACAACCTGCC CGACGTCCAC 
CAGACCCGCT GGCTCTCGCT GTCCCAGTAA

Protein sequence

MTRLPLRTGA CLLAMIVAGA GAAAAQVTLV RGNDTDPATL DHHLTSTVAE SRILNDLYEG 
LVVQDARGEV VPGVAESWEI SEDGLTYSFK LRDDAKWSNG DPVVAGDFVF ALRRIVTPAT 
AAVYANILYP ILNAEAVASG QMTPEELGVE AVDDHTLQIT LNAPTPYFLE LLTHQSSLPL 
HPATVEAEGA NFTRPGVMVT NGAYKLVSFV PNDRIVMEKN EHFHGAQDIA VDRVEWVPFE 
DRSACLRRFE AQEVQICTDV PAEQMSYMRQ NLGEQLRIAP YLGTYYLPVK GADGSPLKDK 
RVRQAISLVL DRDFIAEQVW QETMLPGYSI VPPGISNYVE TPPSLDYAEE DLLDREDRAK 
ALLEEAGVAE GSLTVQLSYN SSENHRNTMT AIADMLKNIG INATLNEMEG TNYFNYLKEG 
GAFDIVRAGW IGDYSDPQNF LFLFEGGVPF NYPRWENADY DALMDRAAQT QDLDERAQIM 
AEAETILLDE VPAIPLLTYS SRALVSDRVQ GYEDNLPDVH QTRWLSLSQ