Gene RPC_2105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2105
Symbol
ID	3973661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2306268
End bp	2307383
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	62%
IMG OID	637925213
Product	extracellular solute-binding protein
Protein accession	YP_531978
Protein GI	90423608
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.681994
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTGTT CGACCGGCTT GCAAAAATTG CGCTTTGTCG CAGCCATGAT CGGTTGCGCG 
GTCCTACTGC TGTCGCCCGC CCGCGCCGAA CAGCGCGTCG TCAACTTCTA CAACTGGTCG 
AACTACATCG CCCCCGGCGT GCTCGACGAG TTCAGCCGCG AGACCGGCAT CAAGGTGATC 
TACGACACCT TCGACGGCAA CGAGACGCTG GAAACGCGGC TGTTGGCGGG AAAATCCGGC 
TACGACGTGG TGGTTCCGAC CGCGTATTTC CTGCAGCGGC AGATCGCCGC CAATATTTTC 
CAGAAGCTCG ACAAGGCGAA GCTGCCGAAC CTCGGCAACG CCTGGGACGT CGTGACCAAG 
CGGCTGGCGA CCTACGATCC CGGCAACCGC TTTGCCGCGA ACTACATGTG GGGCACCACC 
GGGATCGGCT ACAACGTCGC CGCAGTGCGC AAGATCCTCG GCGAGGGCGC TGTGATCGAC 
AGCTGGGCCA CGGTGTTCAA GCCGGAGAAT CTGGCGAAAT TCACCGAGTG CGGCGTGCAC 
ATGCTGGACT CGCCCGATGA TATTTTGCCG GCTGCGCTGA CCTATCTCGG CCTCGATCCG 
AACTCCACCA AGCCGGCCGA TCTGGAAAAA GCCGCCGATC TGGTCGGCAA GATCCGACCC 
TATGTCCGCA AGTTTCATTC CTCGGAATAT CTCAACGCGC TAGCGACCGG CGAAATCTGC 
CTGGTGGTCG CCTGGTCGGG CGACATCATG CAGGCGCGCA GCCGCACCGC CGAGGCCAAC 
AATGGCGTCG AGATCGGCTA TTCGATTCCG AAGGAAGGCG CGCAGATGTT CTTCGACAAT 
CTGGCGATCC CGGCCGACGC CAAGAACGTC GCCGAGGCGC ACGAACTGAT CAACTATCTG 
TACCGCCCCG ACGTCGCGGC GAAGAATTCC GGCTTCCTGT CCTACGCCAA CGGCAATCTG 
GCCAGCCAGA AGCTGATCGA TCCGAAGGTG ATCGGCAACA AGATGGTGTT TCCGGATTCG 
GCGACCGAGA AGCGGCTGTT CGTCATCACC GCGCGCGACG CCGCCACCCA GCGGGTGATC 
AACCGGCTGT GGACCAAGGT GAAGACCGGG ATGTAG

Protein sequence

MRCSTGLQKL RFVAAMIGCA VLLLSPARAE QRVVNFYNWS NYIAPGVLDE FSRETGIKVI 
YDTFDGNETL ETRLLAGKSG YDVVVPTAYF LQRQIAANIF QKLDKAKLPN LGNAWDVVTK 
RLATYDPGNR FAANYMWGTT GIGYNVAAVR KILGEGAVID SWATVFKPEN LAKFTECGVH 
MLDSPDDILP AALTYLGLDP NSTKPADLEK AADLVGKIRP YVRKFHSSEY LNALATGEIC 
LVVAWSGDIM QARSRTAEAN NGVEIGYSIP KEGAQMFFDN LAIPADAKNV AEAHELINYL 
YRPDVAAKNS GFLSYANGNL ASQKLIDPKV IGNKMVFPDS ATEKRLFVIT ARDAATQRVI 
NRLWTKVKTG M