Gene RPB_4046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4046
Symbol
ID	3911853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4615940
End bp	4616947
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	63%
IMG OID	637885950
Product	putative periplasmic solute-binding protein
Protein accession	YP_487650
Protein GI	86751154
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0699034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATTG CTCGTTTCGC TGCGGCGCTG ATCGCGCTGT CGCTGTTCGC CGCCGCGCCG 
GCTGCAAAGG CCGCGGATGT GATCTGCTAC AATTGTCCGC CGCAATGGGC CGACTGGGCG 
TCGATGCTCA AGGCGATCAA GACGGACCTC GGCTACGACA TCCCGTTCGA CAACAAGAAC 
TCCGGCCAGG CGCTGTCGCA ATTGCTGGCC GAGAAGAGTA ATCCGGTTGC GGATATCGGT 
TATTTCGGCG TCAATTTCGG CATGAAGGCC AAGGCGCAGG GCGTCACCCA GCCCTACAAG 
CCGCAGCACT GGAACGAGGT GCCGGCCGGT CTCAAGGACG CCGATGGCGA ATGGACCGCG 
ATCCATTCCG GGACGCTCGG CCTGTTCGTC AATGTCGACG CGCTCGGCGG CAAGCCGGTG 
CCTGCGTGCT GGAAGGATCT GCTGAAGCCG GACTACAAGG GCATGGTCGG CTACCTCGAT 
CCGCCTTCGG CAGCGGTCGG TTATGTCGGC GCGGTCGCGG TCAATCTCGC GCTCGGCGGC 
AGCGACGCCG ACTTCTCGCC GGCGATCGGA TTCTTCAAGG CGCTGCACGG CAACGACGCC 
ATCGTGCCGA AGCAGACGTC CTACGCACGC GTCGTGTCGG GCGAGATCCC GATCCTGTTC 
GACTATGATT TCAACGCCTA CCGGGCCAAG TACACCGAGA AGGGCAAATT CGCCTTCGTC 
ATCCCGTGCG AGGGGTCGGT GGTGTTTCCC TATGTGGTCA GCCTGACCAA GGGCGCGCCG 
AACGCCGAGA AGGCGAAGAA GGTGATCGAC TATCTGTTGT CCGACAAGGG CCAGGCGATC 
TGGACCAACG CCTATCTGCG GCCGGCGCGA CCGATCGAAC TGCCCGAGGC GGTGAAGTCG 
AAATTCCTGC CGGACGCCGA CTACGCCCGC GCCAAGAGTG TCGACTGGGC CAAGATGGAA 
GCGGGCCAGA AGGCGTTCAC TGATCGCTAT CTTGCTGAGG TTCGCTGA

Protein sequence

MTIARFAAAL IALSLFAAAP AAKAADVICY NCPPQWADWA SMLKAIKTDL GYDIPFDNKN 
SGQALSQLLA EKSNPVADIG YFGVNFGMKA KAQGVTQPYK PQHWNEVPAG LKDADGEWTA 
IHSGTLGLFV NVDALGGKPV PACWKDLLKP DYKGMVGYLD PPSAAVGYVG AVAVNLALGG 
SDADFSPAIG FFKALHGNDA IVPKQTSYAR VVSGEIPILF DYDFNAYRAK YTEKGKFAFV 
IPCEGSVVFP YVVSLTKGAP NAEKAKKVID YLLSDKGQAI WTNAYLRPAR PIELPEAVKS 
KFLPDADYAR AKSVDWAKME AGQKAFTDRY LAEVR