Gene RPB_0552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0552
Symbol
ID	3909591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	621810
End bp	623303
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	68%
IMG OID	637882440
Product	peptidase M48, Ste24p
Protein accession	YP_484174
Protein GI	86747678
COG category	[R] General function prediction only
COG ID	[COG4784] Putative Zn-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.125277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0387817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGCAT CCGAGGGACG GCGCAGCATC TGGAGAAGCC GCCGCTGGCT GGCTGTGCCT 
GTCCTGGCGG GCGCGCTGGC GCTGGCCGGC TGCGGCGATT TTCGCCGCTT CGAGACCGCG 
TCGATTCCCT CCAGCACGCC GGCGGCAAAG CCGTCGCGTC CGGCGGCGCA ATCGCCGGCG 
GCCGAGCGCG AGCACGAGCG CATCCTCGCC ACCTATGGCG GCGCCTATGA CGATCCGAGG 
CTCGAAGCGC TGATCACCGC GACGGTCGAT CGGCTGGTGG CGGCGTCCGA CCGTCCCGAC 
CTCACCTACA AGGTGACGAT CCTGAATTCC GGCGCCGTCA ACGCCTTCGC GCTGCCGACC 
GGGCAGCTCT ACGTCACCCG CGGGCTGGTC GCGCTCGCCA GCGACACCTC GGAACTGTCG 
TCGGTGCTGT CGCACGAGAT GGCGCATGTG CTGGCCAAGC ACGCCGCGAT CCGGGAGGAC 
CAGGCGCGCC AGGCGGCGCT GGTCACCCGC GTCGTCACCG ACATGGGCAC CGATCCGGAG 
ATGACCGCGC TGGCGCTGGC CAAGACCAAG CTGTCGATGG CGAGCTTCTC GCGGCAGCAG 
GAGCTCGAGG CCGACGGCAT CGGCGTCGGC ATCTCGGCGC GCGCCCAGTT CGATCCGTTC 
GGAGCTTCGC GTTTCCTCAC CGCGATGGAG CGCAACGCGG CGCTGAAGGC GGGCCGCGGC 
GATGCGCGCT CGCAGGACTT CCTGGCGTCG CACCCGGCGA CGCCGGAGCG GGTGCGCAAC 
GCGCAGAACA ACGCCCGGCA ATACGCCTCG CCGGAGCAGA CCGCCAAGGG CGAGCGCGAC 
CGTGAGACCT ATCTCAACGC CATCGACAAC ATCGTCTATG GCGAGGACCC GAGCGAGGGC 
TTCGTCCGCG GCCGCCGCTT CCTGCATCCC AAGCTCGGCT TCACCTTCCA GGTGCCGGAG 
AGCTTCACGC TCGACAACAC CGCGCAGGCG GTGATCGGCA TCCGCGAAGG CGGCAGCCAG 
GCGATGCGGT TCGACGTGGT GCGGGTGCCG GCGGAACAGT CGCTCGGCGA CTACCTCAAT 
TCCGGCTGGA TGGAGAACGT CGACAAGAGT TCGACCGAAG AACTAAGCAT CAACGGCTTT 
CCGACCGCCT CGGTGGCGGC GCGCGGCGAT CAGTGGCAGT TCAAGGTCTA TGCGTTGCGG 
TTCGGCAGCG ACGTCTATCG CTTCATCTTC GCGACCCGGC AGAAATCGGC CGAAAGCGAC 
CGCAATTCGC GCGACACCGT GAATTCGTTC CGACGTCTGA CGCTCGACGA GATCCAGGCG 
GCGCGGCCGT TGCGGATCAA GGTGATCACC GTACAGCCGG GCGACACGGT GGAATCGCTG 
TCGCACCGGA TGTCCGGCGT CGACCGCCCG CTCGACCGCT TCCGGGTGCT GAACGGCCTC 
GACGCCAACG CCACCGTGAA GCCGCGCGAT CTGGTCAAGA TCGTGGTGGA TTAA

Protein sequence

MIASEGRRSI WRSRRWLAVP VLAGALALAG CGDFRRFETA SIPSSTPAAK PSRPAAQSPA 
AEREHERILA TYGGAYDDPR LEALITATVD RLVAASDRPD LTYKVTILNS GAVNAFALPT 
GQLYVTRGLV ALASDTSELS SVLSHEMAHV LAKHAAIRED QARQAALVTR VVTDMGTDPE 
MTALALAKTK LSMASFSRQQ ELEADGIGVG ISARAQFDPF GASRFLTAME RNAALKAGRG 
DARSQDFLAS HPATPERVRN AQNNARQYAS PEQTAKGERD RETYLNAIDN IVYGEDPSEG 
FVRGRRFLHP KLGFTFQVPE SFTLDNTAQA VIGIREGGSQ AMRFDVVRVP AEQSLGDYLN 
SGWMENVDKS STEELSINGF PTASVAARGD QWQFKVYALR FGSDVYRFIF ATRQKSAESD 
RNSRDTVNSF RRLTLDEIQA ARPLRIKVIT VQPGDTVESL SHRMSGVDRP LDRFRVLNGL 
DANATVKPRD LVKIVVD