Gene PP_5028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_5028
Symbol	pip
ID	1045446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	-
Start bp	5729386
End bp	5730357
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	64%
IMG OID	637148427
Product	proline iminopeptidase
Protein accession	NP_747129
Protein GI	26991704
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACCC TCTACCCGCA GATCAAACCC TACGCCAGGC ACGATCTGGC CGTGGAAGCG 
CCGCATGTGC TTTATGTCGA CGAAAGCGGC TCGCCGGAAG GTCTGCCCGT GGTGTTCATC 
CACGGAGGCC CCGGTGCTGG CTGCGACGCC CAGAGCCGCT GCTACTTTGA TCCCAACCTG 
TACCGCATCA TCACCTTCGA CCAGCGCGGC TGTGGCCGCT CCACGCCCCA TGCGAGCCTG 
GAGAACAACA CCACCTGGCA CCTGGTCGAA GACCTGGAGC GCATTCGCGA ACACCTTGGC 
ATAGACAAGT GGGTGCTGTT CGGTGGTTCT TGGGGCTCGA CCCTGGCCCT GGCCTACGCT 
CAGGCTCACC CCGAACGCGT GCACGGCCTG ATCCTGCGCG GCATCTTCCT GTGCCGGCCG 
CAGGAAATCG AGTGGTTCTA CCAGGAAGGC GCCAGCCGCC TGTTCCCCGA CTACTGGCAG 
GACTACATCG CACCGATTCC ACCGGAGGAA CGCGGCGACC TGGTCAGGGC CTTCCACAAG 
CGCCTGACCG GTAACGACCA GATCGCCCAG ATGCACGCCG CCAAGGCGTG GTCCACCTGG 
GAAGGCCGTA CCGCCACCCT GCGCCCCAAC CCGCTGGTGG TCGACCGCTT TTCCGAACCG 
CAGCGGGCGC TGTCGATCGC CCGCATCGAA TGCCACTACT TCATGAACAA CGCCTTCCTC 
GAACCGGACC AGCTGATCCG CGATCTGCCC AAAATCGCCC ACCTGCCGGC GGTGATCGTG 
CATGGTCGCT ACGATGTGAT CTGCCCCTTG GACAACGCCT GGGCGTTGCA CCAGGCCTGG 
CCGAACAGTG AGTTGAAAGT GATCCGTGAC GCCGGTCACG CGGCTTCCGA GCCTGGCATC 
ACCGATGCCT TGGTGCGTGC CGCCGACCAG ATGGCCCGGC GCCTGCTCGA TTTGCCTCTG 
GAAGAAGCAT GA

Protein sequence

MQTLYPQIKP YARHDLAVEA PHVLYVDESG SPEGLPVVFI HGGPGAGCDA QSRCYFDPNL 
YRIITFDQRG CGRSTPHASL ENNTTWHLVE DLERIREHLG IDKWVLFGGS WGSTLALAYA 
QAHPERVHGL ILRGIFLCRP QEIEWFYQEG ASRLFPDYWQ DYIAPIPPEE RGDLVRAFHK 
RLTGNDQIAQ MHAAKAWSTW EGRTATLRPN PLVVDRFSEP QRALSIARIE CHYFMNNAFL 
EPDQLIRDLP KIAHLPAVIV HGRYDVICPL DNAWALHQAW PNSELKVIRD AGHAASEPGI 
TDALVRAADQ MARRLLDLPL EEA