Gene RPD_1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1032
Symbol
ID	4021508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1182373
End bp	1183398
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	637961224
Product	extracellular solute-binding protein
Protein accession	YP_568171
Protein GI	91975512
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.284122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGCA AAATCATATC AGGCGTCGTG GCGCTGGCGG TTGTGGGCAC CGCGTCGGCC 
CTCGTCGCGC AACCGGCGTC GATCACCATC GTCAATCCGG GCGGCCCCTA TCTCGAGGCG 
ACGCTGGAGG CCTGGGGCAA GACCTTCACC GAGAAGACCA ACATCAAGGT GAAGGGCGAC 
TCCCCGCAGA GCCTGCCGAA GATCCAGCAG ATGGTCGGCG CCAAGAACGT GTCGTGGGAT 
GTCGTCGAAG TGCCGCCGGT GTTCACGATG CGCCATTGCG GCACGCTGTT CGAAAAGCTC 
ACGCCCGGTC TCGTCGACGC GGCGCGCGTC AATGCGGGAT TCGGCAATGA ATGCGGCGTG 
CCGGATGCGG GCTACGCCAA CATCATGCTC TACAACAAGA CCAAGTTCGC AAAGGGCGGC 
CCGCAGAACT GGGCCGACTT CTTCGACGTC AAGAAGTTTC CCGGCAAGCG CGGCCTGTGG 
GACGGCGCCG AGGGCGTGAA TCTCGAAATC GCGCTGCTGG CCGACGGCGT TGCTCCGGAG 
AACCTCTATC CGCTCGACCT GGATCGCGCG TTCCGCAAGC TCAGCGAACT CAAGCCGCAT 
ATCGTGTTCT GGCGAACCGG CGCGCAATCC ACCCAGATGA TGGAAAGCGG CGAAGTCGAC 
ATGATCATGG CGTGGTCGTC GCGCGCCTAT CCGGCGCTGA AGAACGGCGC GCCGTTCGAG 
CCGGTGTGGA ACCAGCACAT CATCTACAAC AACGTTCTGG CGATTCCGAT GGGCGCGCCG 
AACAAGGCCG CCAGCGAAGC CTATATTCGC CATGCGCTCG AGGACAAACA GCAGGCCCGC 
ATCACCGAGC TCTATCCGGT CACGCCCGCG CTGATCGGCG CCGCTCCGAA GCTCGACGAG 
GCAGGCATGA AAGTCTTCGC CGGCACGCCT GAGCGGGCCA AGACCGCGAT CCGCCTCAAT 
CTGAAATGGG TCGCCGACAA TTCCGAAGTG ATCCAGAAGC GCTGGATCGA GTGGTTGAAC 
TCCTGA

Protein sequence

MSRKIISGVV ALAVVGTASA LVAQPASITI VNPGGPYLEA TLEAWGKTFT EKTNIKVKGD 
SPQSLPKIQQ MVGAKNVSWD VVEVPPVFTM RHCGTLFEKL TPGLVDAARV NAGFGNECGV 
PDAGYANIML YNKTKFAKGG PQNWADFFDV KKFPGKRGLW DGAEGVNLEI ALLADGVAPE 
NLYPLDLDRA FRKLSELKPH IVFWRTGAQS TQMMESGEVD MIMAWSSRAY PALKNGAPFE 
PVWNQHIIYN NVLAIPMGAP NKAASEAYIR HALEDKQQAR ITELYPVTPA LIGAAPKLDE 
AGMKVFAGTP ERAKTAIRLN LKWVADNSEV IQKRWIEWLN S