Gene RPD_2082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2082
Symbol
ID	4022564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2331650
End bp	2332762
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	62%
IMG OID	637962275
Product	extracellular solute-binding protein
Protein accession	YP_569218
Protein GI	91976559
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.472813
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.985512
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGAAA ATTGCTACCG GCGGCTGCGC TTGGGAGGCG CGGCGATCGT GTTGATCGCG 
GGTCTGAACG CGCCGGCGCT GGCGCAGGAA CGCGTGGTCA ATTTCTACAA CTGGTCGAAC 
TATGTCGCCC CGGGCGTGCT GGAAGAGTTC ACGCGCGAGA CCGGAATCAA GGTGGTCTAC 
GACACCTTCG ACGGCAACGA GACGCTGGAA GCCAAGCTTC TTGCCGGAAA GTCCGGCTAC 
GACGTCGTGG TGCCGACCGC CTATTTCCTG CAACGCCAGA TCGGCGCGAA GGTGTTCCAG 
AAGCTGGATG CGTCCAAGCT GCCGAACTTG AAGAACGCCT GGGACGTGGT GACGAAGAAG 
CTCGCGCTGT ACGATCCCGG CAATCAATAC GCCGCGAACT ACATGTGGGG CACTACCGGG 
ATCGGCTACA ACGTCGCGGC GGTGAAGAAG ATTTTCGGTC CCGATGCGGT GATCGACAGC 
TGGGACATCG TTTTCAAGCC TGAGAATCTG GCGAAGCTCA AGGATTGCGG CGTCCAGATG 
CTGGACTCGG CGGACGACAT TCTGCCGGCG GCGCTGACCC ATCTCGGCCT CGACCCCAAC 
TCGACCAAGC AGCCCGATCT GGAGAAGGCC GCCGACGTCG TCGCCAAGGT GCGGCCGTCA 
GTCCGCAAGT TTCACTCGTC CGAATACCTC AACGCGCTCG CCACCGGCGA GATTTGCCTC 
GTGGTCGGCT GGTCCGGCGA CATCAAGCAG GCGCAGTCGC GTGCGGCGGA GGCCAAGAAC 
GGTGTTGATA TCCGCTATGC GATCCCGAAG GAGGGCGCGC AGATGTTCTT CGACAATCTG 
GTGATCCCGG CCGACGCCAA GAACGTTGCT GAGGCGCACG AGCTGATCAA CTTCCTGTAT 
CGCCCGGACA TCGCTGCGCG CAATTCCGAC TTCCTGTCCT ACGCTAACGG CAACAAGGCC 
AGCCAGGAAT TCGTCAATGC CCGCGTGCTG AGCGACAAGA CGATCTATCC TGACGAGGCG 
ATGCAGGCGC GGCTGTTCGT GATCACGGCG CGCGATCCGG CAATCCAGCG ATCGATCAAC 
CGGCTGTGGA CGCGGGTGAA GACGGGACGG TGA

Protein sequence

MRENCYRRLR LGGAAIVLIA GLNAPALAQE RVVNFYNWSN YVAPGVLEEF TRETGIKVVY 
DTFDGNETLE AKLLAGKSGY DVVVPTAYFL QRQIGAKVFQ KLDASKLPNL KNAWDVVTKK 
LALYDPGNQY AANYMWGTTG IGYNVAAVKK IFGPDAVIDS WDIVFKPENL AKLKDCGVQM 
LDSADDILPA ALTHLGLDPN STKQPDLEKA ADVVAKVRPS VRKFHSSEYL NALATGEICL 
VVGWSGDIKQ AQSRAAEAKN GVDIRYAIPK EGAQMFFDNL VIPADAKNVA EAHELINFLY 
RPDIAARNSD FLSYANGNKA SQEFVNARVL SDKTIYPDEA MQARLFVITA RDPAIQRSIN 
RLWTRVKTGR