Gene Rpal_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4151
Symbol
ID	6411835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4443867
End bp	4444856
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	69%
IMG OID	642714033
Product	proline iminopeptidase
Protein accession	YP_001993122
Protein GI	192292517
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCTCG ATCCGGAAGC CGAAGCTCCG TCCAGCCAGC GCCCGGGCGC TGACGCACCG 
CTGTCCTCGC AGATGCTCGC AGTCGGCGAC GGCCACGAAC TCTATGTCGA AAGCAACGGC 
CGCGCCGACA GCATCCCGGC AGTGTATCTG CATGGTGGTC CCGGCAGTGG CTGTCAGGTC 
GATCATCGCC GGCTGTTCGA CCCGCAACGA TTTCACGCCG TGCTGTTCGA TCAGCGCGGC 
GCCGGACGCA GCCGCCCAAA GGGCGGGCGC GAGGCCAACA CGCTGCCGCA TCTGATCGCC 
GACCTGGAGG CGATCCGCGG TCACTACGGC TTCGAACGCT GGATGGTGGT CGGCGGCTCA 
TGGGGCGCGA CGCTCGCGCT GGCCTATGCC GAAACGCATC CAGAGCGCGT CACCGGCCTG 
GTGCTGCGCG CGACGTTTCT GGGCACCCAC TCGGAGCTCG AAACCGCGTT CTTGTCGACG 
CTGCCGCGAT TCTATCCGGC GCTGTACGAC GACTTCCTGA GCGTGCTTCC CGAAGCCGAG 
CGCGCCAATC CGCTCGACGC CTATTGGCGC CGCATCCTCG ATCCCGATCC CGCCGTGCAC 
GCGCCGGCCG CGCGCGCCTG GGGAGAGACC GAAGGCATTC TCTCGACCAT CGCGCCGCGG 
CGGACGCGGC TCGATCGCGC CGCGCTGTCC GGCACCGGTC CGCTGCCGTC CACGCCATTC 
ATGGAGGCGC ACTACTTCGC CCACGACTGC TTCCTGCAGC CGGACCAGTT GCTGCGCGAT 
GCACCGAAGC TCGCCGGCAT TCCGGGTGTG ATCGTACAAG GCCGCTACGA TCTTCTGTGC 
CCACCGTCCA CCGCGCAACG CCTCGCGGCG CGATGGCCGG AGGCCGAGCT GCGCACCATC 
GATGCCGCCG GCCACCTGCT CTACGACCCC GGCATCCGCG ACGCGGTGAT CGCCGGAATC 
ACCGACGTCG CTGCGAAGAT CGCCGGCTGA

Protein sequence

MPLDPEAEAP SSQRPGADAP LSSQMLAVGD GHELYVESNG RADSIPAVYL HGGPGSGCQV 
DHRRLFDPQR FHAVLFDQRG AGRSRPKGGR EANTLPHLIA DLEAIRGHYG FERWMVVGGS 
WGATLALAYA ETHPERVTGL VLRATFLGTH SELETAFLST LPRFYPALYD DFLSVLPEAE 
RANPLDAYWR RILDPDPAVH APAARAWGET EGILSTIAPR RTRLDRAALS GTGPLPSTPF 
MEAHYFAHDC FLQPDQLLRD APKLAGIPGV IVQGRYDLLC PPSTAQRLAA RWPEAELRTI 
DAAGHLLYDP GIRDAVIAGI TDVAAKIAG