Gene Rsph17029_0132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0132
Symbol
ID	4895266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	147385
End bp	148974
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	65%
IMG OID	640110715
Product	extracellular solute-binding protein
Protein accession	YP_001042024
Protein GI	126460910
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.229364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.957515
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTCT TCTCGCTCCG AGCCGGCGCC TGCGCGCTGG CGCTGATGGC CGGCACGGCA 
GGCATGGCCG CGGCGCAGGT GACCATCGTC CGCGGCAACG ATACGGACCC TGCGACGCTC 
GACCATCACC TGACCTCGAC CGTCGCCGAG AGCCGGATCA TGAACGACCT CTACGAGGGG 
CTCGTGGTGC AGGACGCGCA GGCGAAGGTC GTGCCCGGCG TGGCCGAAAG CTGGGAGATC 
TCGGAGGACG GTCTCACCTA CACCTTCAAG CTCCGGGACG ACGCCAAGTG GTCGAACGGC 
GATCCCGTCG TGGCCGAGGA TTTCGTCTTT GCCCTGCGGC GCATCATGAC CCCGGCCACG 
GCGGCGGTCT ATGCCAACAT CCTCTACCCG ATCGCCAATG CGGAGGCCAT CGCCACCGGC 
GCCAAGCAGC CCGAGGAGCT GGGCGTCGAG GCGGTGGACG CGCACACGCT GAAATTCACC 
CTGAACGCGC CCACGCCCTA TTTCCTCGAA CTGCTGACGC ACCAGTCCTC GCTGCCGATG 
CACCGGGCGA CGGTCGAGGC GGAAGGGTCG AACTTCACCA AGCCCGGCGT GATGGTCACG 
AACGGCGCCT ACAAGCTGGT CAGCTTCGTG CCCAACGACC GCATCGTGAT GGAGAAGAAC 
GAGCATTTCC ACGGTGCGGC CAATGTGGCC ATCGACCGCG TGGAATGGGT GCCCTTCGAG 
GACCGCTCGG CCTGTCTGCG CCGGTTCGAG GCGGGCGAGG TGCAGATGTG CACCGACGTT 
CCGGCCGAAC AGATGGCCTA CATGCGCGAG AACCTGAAGG ACGAGCTGCA TATCGCGCCC 
TACCTCGGCA CCTACTACCT GCCGGTGAAG GGCGCCGACG GCAGCCCGCT GAAAGACAAG 
CGGGTGCGGC AGGCGATCTC GATGGTGCTG GATCGTGACT TCATCGCCGA GGAGGTCTGG 
CAGGAGACGA TGCTGCCCGG CTATTCGATG GTGCCTCCGG GCATCTCGAA CTATGTCGAG 
ACCCCGCCCG CGCTCGACTA TGCCGACGAG GATCTGCTCG ACCGCGAGGA CAAGGCCAAG 
GCGCTGCTCG AGGAAGCGGG CGTGGCCGAG GGCAGCCTCA CCGTGCAGCT CTCCTACAAC 
TCGTCCGAGA ACCACCGGAA CACGATGACG GCCATCGCCG ACATGCTGAA GAACATCGGC 
ATCAACGCGA CGCTGAACGA GATGGAAGGC ACGAACTACT TCAACTACCT GAAGGAAGGC 
GGCGCCTACG ACATCGTGCG CGCGGGCTGG ATCGGCGACT ATTCCGACCC GCAGAACTTC 
CTGTTCCTGT TCGAGGGCGG CGTGCCCTTC AACTATCCGC GCTGGGAGAA TGCCGAATAC 
GACGCGCTGA TGGACAAGGC GGCCGTCACG CAGGATCTCG GGCAGCGCGC GCAGATCATG 
GCCGATGCCG AGACGATCCT GCTCGACGAG GTGCCGGCGA TCCCGCTGCT GACTTATTCC 
TCGCGGGCGC TCGTGTCCGG CAAGGTGCAG GGCTACGCGG ACAACCTGCC CGACGTGCAC 
CTCACCCGCT GGCTCTCGCT CGCCGAGTAA

Protein sequence

MTLFSLRAGA CALALMAGTA GMAAAQVTIV RGNDTDPATL DHHLTSTVAE SRIMNDLYEG 
LVVQDAQAKV VPGVAESWEI SEDGLTYTFK LRDDAKWSNG DPVVAEDFVF ALRRIMTPAT 
AAVYANILYP IANAEAIATG AKQPEELGVE AVDAHTLKFT LNAPTPYFLE LLTHQSSLPM 
HRATVEAEGS NFTKPGVMVT NGAYKLVSFV PNDRIVMEKN EHFHGAANVA IDRVEWVPFE 
DRSACLRRFE AGEVQMCTDV PAEQMAYMRE NLKDELHIAP YLGTYYLPVK GADGSPLKDK 
RVRQAISMVL DRDFIAEEVW QETMLPGYSM VPPGISNYVE TPPALDYADE DLLDREDKAK 
ALLEEAGVAE GSLTVQLSYN SSENHRNTMT AIADMLKNIG INATLNEMEG TNYFNYLKEG 
GAYDIVRAGW IGDYSDPQNF LFLFEGGVPF NYPRWENAEY DALMDKAAVT QDLGQRAQIM 
ADAETILLDE VPAIPLLTYS SRALVSGKVQ GYADNLPDVH LTRWLSLAE