Gene RPC_0166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0166
Symbol
ID	3971271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	181243
End bp	182601
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	65%
IMG OID	637923279
Product	carboxyl-terminal protease
Protein accession	YP_530060
Protein GI	90421690
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.97074
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGCA AGACTTCGGT AATTCTGCTG AGCGTTGCCA CCGGCGCGGC GCTCACATTG 
TTCGTGACCC AACCGCGATC GATCCTGATG GGATCCACCG CGCGGGCCGC GACCTCCGAC 
ACCTATCGCC AGCTCAATCT GTTCGGCGAC GTGTTCGAAC GGGTGCGCAG CGACTATGTC 
GAAAAGCCCG ACGACTCCAA GCTGGTGGAA TCCGCGATCA GCGGCATGCT GACCGGGCTC 
GATCCGCATT CCAGCTACAT GGATGCCAAG AGCTTCCGCG ACATGCAGGT GCAGACCCGC 
GGCGAGTTCG GCGGCCTCGG CATCGAGGTC ACCATGGAAG ACGGTCTGAT CAAGGTGGTG 
TCGCCGATCG ACGATACCCC GGCCTCGAAG GCCGGCATTA TGGCCAACGA CATCATCACC 
AATCTCGACG ACGAGGCGGT GCAGGGCCTG ACGCTCAATC AGGCGGTCGA GAAGATGCGC 
GGCCCGGTCA ACACCAAGAT CCGGCTGAAG ATCGTCCGCA AGGGCCAGGA CAATCCGATC 
GACGTCACTT TGGTGCGTGA CAACATCCGC GTCCGCTCGG TGCGCGCCCG CGTCGAAGGC 
GACGACATCG GCTACATCCG CATCACCACC TTCAACGAGC AGACCACCGA AGGCTTGAAG 
CGCGAACTCG CCGCCCTCAC CACCCAGATC GGCAACGACA AGCTGAAGGG CTGGATTCTC 
GACCTGCGCA ACAACCCGGG CGGCCTCTTG GAAGAAGCCG TGACGGTGTC GGATGCGTTC 
CTTGATCGCG GCGAAATCGT CTCCACCCGC GGCCGCAACG CCGAAGAAAC CCAGCGCCGC 
GCCGCCCATG GGGGCGACCT CGCCAAGGGC AAGCAGGTCA TCGTGCTGAT CAATGGCGGC 
TCGGCTTCGG CGTCGGAAAT CGTCGCCGGC GCGCTGCAGG ATCACAAGCG CGCCACGCTG 
GTCGGCACCC GCTCGTTCGG CAAGGGCTCG GTGCAGACCA TCATTCCGCT CGGAAGCGGC 
AACGGCGCGC TGCGGCTGAC CACGGCGCGC TACTTCACGC CGTCCGGCAA GTCGATCCAG 
GCCAAGGGCA TCACCCCGGA CATCGAGGTG CTGCAGGACG TGCCCGACGA GATCAAGTCG 
CGCACCGACA CCAAGGGCGA AGCCTCGCTG CGCGGCCATC TGAAGGCCGA AGGCGACGAG 
AAGACCGGGT CGCAATCCTA CGTGCCGCCG GAAGCCAAGG ACGACAAGGC GTTGAAGATG 
GCGGCCGACC TGCTGCACGG CGTCAAGGTC AACGCCACCG CGCCGGCCAC CGGCGACAAG 
GCGGCGATCG ACAAGCCGGC CGGCAAGGTC GAGAACTGA

Protein sequence

MMRKTSVILL SVATGAALTL FVTQPRSILM GSTARAATSD TYRQLNLFGD VFERVRSDYV 
EKPDDSKLVE SAISGMLTGL DPHSSYMDAK SFRDMQVQTR GEFGGLGIEV TMEDGLIKVV 
SPIDDTPASK AGIMANDIIT NLDDEAVQGL TLNQAVEKMR GPVNTKIRLK IVRKGQDNPI 
DVTLVRDNIR VRSVRARVEG DDIGYIRITT FNEQTTEGLK RELAALTTQI GNDKLKGWIL 
DLRNNPGGLL EEAVTVSDAF LDRGEIVSTR GRNAEETQRR AAHGGDLAKG KQVIVLINGG 
SASASEIVAG ALQDHKRATL VGTRSFGKGS VQTIIPLGSG NGALRLTTAR YFTPSGKSIQ 
AKGITPDIEV LQDVPDEIKS RTDTKGEASL RGHLKAEGDE KTGSQSYVPP EAKDDKALKM 
AADLLHGVKV NATAPATGDK AAIDKPAGKV EN