Gene RPB_4242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4242
Symbol
ID	3912050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4819161
End bp	4820180
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	58%
IMG OID	637886144
Product	putative phosphate-binding periplasmic protein
Protein accession	YP_487843
Protein GI	86751347
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.391821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGTCTC TCTTGAGAAT CGACATTATT TCGGTCGCGG TGGCCTGCGT CGCGTTCGCC 
GCCGCATCAG TCGGTCCGGC CGAGGCCCGC GATCAGCTAT GGATCGCCGC TTCACCCTCC 
GACCAGAGCT TCGCCAAGGC TGTGTCCGTG CAATTCGGCA GAGCCGGCAG GTTCAAGACA 
CCCATCGTGA AAGACGGAGG CCCGCCAGCC GGGTTAATGT CGTTCTGCCG CGGCGTCGGC 
CCCGACAATT TCGATATCGC TTTCTCCTCG CGCCGGATCG CTTCTTCCGA AGTCGAGCTC 
TGCAATAAGA ACGGCGTCAA AGACATTACT CAAGTGCAGT TTGGCTATGA TGCCCTTGTG 
TTTGTCACCA ATAAGGCGAG CCAGACCCCG GCCCTCTCGC GCACGGCTGT CTACCTTGCG 
ATCGCGCGGG ACGTTCCGGA CAAAGGCACG TTGGCGTCAA ATACGAGCAA GCCGGCCAAT 
ACCCTCTACA TTCCGAGCGC TAACCACGGT GCGCGCGACG TGTTCGACGA AATGCTGATG 
GTTTCGTCGT GCACGTCCAC CGGGGCCTAC GCGATTATCC AGAAAACCAA TCCAGACAAA 
TCCAAAGTAG CGGCGCAATG TCGGGCAGCG CGGCAAGCCG CGAATGTGGT CAATATGGAT 
AGCGACAGCG GCACACTCGC TCGTCTTCAA TCCGATCCCA AGGGCGTCGG CGTGGTCACC 
TGGTCTTTCT ACACGAACAA CGACGACAAG TTGAAAGTTG TCGCTTTGGA CGGCGTCGTC 
CCGTCGAAAG CGACGGTGGC TTCAGGCACA TTCCCGATAG CGTACCCTCT CTATTTGTAT 
GTGAAAAAGG CTCAAATCGG CCAGATCCCG GGGATTAAGG AGTGGATCGC CGAATTCACG 
AGTGAAAATG CGTTCGGCCC TGACGGCTAT CTTGGGGATA GCGGCCTCGT CTCAATGCCG 
GATGCACAGA GGCGACAGTC GCGTGCTGAT GCCCAGGCCC TCGTATCATA TAAACCTTGA

Protein sequence

MGSLLRIDII SVAVACVAFA AASVGPAEAR DQLWIAASPS DQSFAKAVSV QFGRAGRFKT 
PIVKDGGPPA GLMSFCRGVG PDNFDIAFSS RRIASSEVEL CNKNGVKDIT QVQFGYDALV 
FVTNKASQTP ALSRTAVYLA IARDVPDKGT LASNTSKPAN TLYIPSANHG ARDVFDEMLM 
VSSCTSTGAY AIIQKTNPDK SKVAAQCRAA RQAANVVNMD SDSGTLARLQ SDPKGVGVVT 
WSFYTNNDDK LKVVALDGVV PSKATVASGT FPIAYPLYLY VKKAQIGQIP GIKEWIAEFT 
SENAFGPDGY LGDSGLVSMP DAQRRQSRAD AQALVSYKP