Gene RPD_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0235
Symbol
ID	4020693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	273587
End bp	274672
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	69%
IMG OID	637960414
Product	hypothetical protein
Protein accession	YP_567376
Protein GI	91974717
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCCG CCCTTCTGCT CGCACCCGAA CTGGACGACG TCGTCGGCCA TGGCGATGCC 
GCGCGGCGCG CCGATGCCGT GCGGCGGATC GCCGACCTGT TCGTGCAAGG CGCGATGAAT 
TTCAACGCCG AACATGTCGC GGTGTTCGAC GGCGTCCTGG TGCGACTGAT ACCCGACACC 
GACGGCGATC TGCGCGGCGA GCTGGCGCGG CGGTTCTGCT CGCTCGGCAA CGCGCCGCCG 
ACGCTGATTG AGCAATTGGC GCAGGATGAG GACATCGGCG TTGCCGGGCC GCTGTTGCGA 
CGCTCGACGC AGATCACCGA CGACACGCTG GTGGAGCTCG CCGAAGTGCG CGGCCAGACC 
CATCTGATGG CGATCTCCGA GCGGCCGGCG ATCTCGCCGC CGGTCACCGA CGTGATCGTC 
CGCCGTGGCG ATCGCGACGT GTTGCGGATG GTCGCGGTGA ATGCCGGCGC GGCGTTTTCA 
GCCTTTGGCT TCAGCGGCCT GATCCGCCGC GCGGCACAGG ACGGCGTGCT GGCCGTCGCC 
GTCGGCGTGC GTGACGACCT GTCGTTGCCG CGGTTGAAAG ATCTGCTGGC GTCCTCGAGC 
GAACCGGTGC GCCGGAAGCT GTTCGAAACG GCGTCGCCGA GCGCCCGAAT CGCGATCAAC 
CGCGCGCTGC GCGAACTCAC CGGCGAGCCG ATGCAGCCCT CGGTGAAGCG CGACTTTGCG 
CCGGCGCAAC GCGCGATCGT GGCGCTGCAT AATGCCGGCG GCCTCACCGA GCAGGCGCTG 
CTCAGCTTCG CCCGGGCATT CCAATACGAG GAAACGGTGG CGGCGCTGTC GGCGATGTCC 
GGCGTGCGGA TCACGACGCT CGACCCGTTG ATGGCGGGCG AACGCCACGA CCCGATGCTG 
ATGCTCGGCA AGGCGCTCGG CCTCGACTGG ACCACGGTGC GCGCGATGAT CGGGCTGCGG 
CGCGGGCCGG ACCGGATGCC GTCCTCGCCC GACGTCGAGG AGGCGCGGCA GAATTTCGAG 
CGGCTGGCGC CCTCGACCGC ACATCAGGTG GTCGGCTTCT GGAAAATGCG ACAGGCGATG 
AACTGA

Protein sequence

MSAALLLAPE LDDVVGHGDA ARRADAVRRI ADLFVQGAMN FNAEHVAVFD GVLVRLIPDT 
DGDLRGELAR RFCSLGNAPP TLIEQLAQDE DIGVAGPLLR RSTQITDDTL VELAEVRGQT 
HLMAISERPA ISPPVTDVIV RRGDRDVLRM VAVNAGAAFS AFGFSGLIRR AAQDGVLAVA 
VGVRDDLSLP RLKDLLASSS EPVRRKLFET ASPSARIAIN RALRELTGEP MQPSVKRDFA 
PAQRAIVALH NAGGLTEQAL LSFARAFQYE ETVAALSAMS GVRITTLDPL MAGERHDPML 
MLGKALGLDW TTVRAMIGLR RGPDRMPSSP DVEEARQNFE RLAPSTAHQV VGFWKMRQAM 
N