Gene RPB_0788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0788
Symbol
ID	3909276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	883066
End bp	884331
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	64%
IMG OID	637882680
Product	putative OpgC protein
Protein accession	YP_484410
Protein GI	86747914
COG category	[S] Function unknown
COG ID	[COG4645] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.904469
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.107967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCG TCGTCTCGTC CGTCGCCGAA CAGACCGCAG GAGCGCCGCC GGGAGGCTTG 
CCGCCGACGG ACGCTGCCGC GCTGTCGTCG CCGCCGCTGC AGCCGGAGCT GCGCAAGCCG 
GCGCCGAAGC GGGAATTGCG GCTCGATCTG TTCCGCGGCC TGGCGCTGTG GCTGATCTTC 
ATCGATCATC TGCCGGCCAA TGTGCTGACC TGGCTGACGA TCCGGAACTA CGGCTTTTCC 
GACGCCACCG AGATCTTCAT CTTCATTTCC GGCTACACCG CCGCTTTCGT CTACGGACGG 
GCGATGCGCG ATCAGGGCGT GGTGGTGGCG TCGGCGCGGA TCATGAAGCG GGTCTGGCAG 
ATCTATGTCG CCCACGTGTT TCTGTTCACG ATCTTCCTCG CCGAGATCTC CTACGTCGCC 
ACCAGCTTCC AGAACCCGCT CTACACCGAG GAAATGGGCA TCCTGGATTT CCTCAAACAG 
CCCGACGTCA CCATCGTGCA GGCGCTGCTG CTGCGGTTTC GCCCGGTCAA TATGGACGTG 
CTGCCGCTGT ACATCGTGCT GATGTTCTTC CTGCCGCCGA TCCTGTGGAC GATGCGGCGC 
TCGCCCGATC TGGCGCTGGC GCTGTCGACC GCGCTCTATG TCGCGACCTG GCAGTTCGAC 
CTGCACCTCA CCGCCTATCC GAGCGGCGTC TGGGCGTTCA ATCCCTACGC ATGGCAGTTG 
CTGTTCGTGT TCGGCGCCTG GTGCGCGATG GGCGGCGCGC AGCGGCTGTC GCGGGTGCTG 
GCGTCGAACA TCACGCTGGG GTTGTCGGTG GCCTATCTGC TGGCGGCGTT CTTCATCGTG 
CTGACCTGGC ACATGCCGCA GCTCTATCAC ATCCTGCCGA AATGGCTCGA GCAGTGGATG 
TACCCGATCG ACAAGCCCAA TCTCGACGTG CTGCGGTTCG CCCACTTCCT GGCGCTGGCG 
GCGATCACCG TGCGGTTTCT GCCCCGCGAC TGGCCCGGCC TCAATTCGGT CTGGCTGCGG 
CCGATGGTGC TGTGCGGCCA GCATTCGCTG GAAATCTTCT GCCTCGGCAT CTTCCTTGCA 
TTCGCGGGCT ACTTCATATT GGCCGAGATC TCCGGCGGAG CGGTGATGCA TTTCTTCGTC 
AGTCTGGCCG GCGTCGTTAT CATGTCCGCC TCGGCATGGC TGCTTTCGTG GTACAAGAAC 
GCGGTGGCGA AGGGCGGCAA TCAGAAAACA AGCCCGGATG CCGACCTCGC AGGGGGGGAT 
GCATGA

Protein sequence

MTAVVSSVAE QTAGAPPGGL PPTDAAALSS PPLQPELRKP APKRELRLDL FRGLALWLIF 
IDHLPANVLT WLTIRNYGFS DATEIFIFIS GYTAAFVYGR AMRDQGVVVA SARIMKRVWQ 
IYVAHVFLFT IFLAEISYVA TSFQNPLYTE EMGILDFLKQ PDVTIVQALL LRFRPVNMDV 
LPLYIVLMFF LPPILWTMRR SPDLALALST ALYVATWQFD LHLTAYPSGV WAFNPYAWQL 
LFVFGAWCAM GGAQRLSRVL ASNITLGLSV AYLLAAFFIV LTWHMPQLYH ILPKWLEQWM 
YPIDKPNLDV LRFAHFLALA AITVRFLPRD WPGLNSVWLR PMVLCGQHSL EIFCLGIFLA 
FAGYFILAEI SGGAVMHFFV SLAGVVIMSA SAWLLSWYKN AVAKGGNQKT SPDADLAGGD 
A