Gene PSPTO_5164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PSPTO_5164
Symbol	pip
ID	1186849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas syringae pv. tomato str. DC3000
Kingdom	Bacteria
Replicon accession	NC_004578
Strand	-
Start bp	5876768
End bp	5877739
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	637396483
Product	proline iminopeptidase
Protein accession	NP_794895
Protein GI	28872276
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGACTT TGTACCCGCA GATCAAACCC TACGCCCGGC ACGATCTGGC CGTGGAACAA 
CCGCATGTGC TCTACGTCGA TGAAAGCGGT TCGCCTGAAG GTTTGCCTGT GGTGTTCATT 
CACGGTGGCC CGGGTTCTGG ATGCGATGCG CACAGCCGCT GCTATTTCGA TCCCAACCTG 
TACCGAATTG TTACCTTCGA TCAGCGTGGC TGTGGCCGCT CCACACCTCA TGCCAGCCTC 
GAAAACAATA CCACCTGGAA GCTGGTGGAA GACCTTGAGG TCATTCGCGA GCACTTGGGC 
ATCGACAAAT GGGTACTGTT CGGCGGCTCG TGGGGTTCGA CCCTCGCGCT GGCTTACGCT 
CAGACCCACC CCGACCGCGT GCATGCGCTG ATTCTGCGTG GCGTGTTTCT GGCCCGTCAG 
CAAGAAATCG ACTGGTTCTA TCAAGCGGGT GCCAGCCGCC TGTTCCCCGA TTACTGGCAG 
GACTACGTCG CCCCTATCCC GTTGGATGAG CGCAACAATA TTCTCGCTGC CTTTCACAAG 
CGTCTCACCG GCGCAGACCA GATTGCCCAG ATGCATGCCG CCAAGGCCTG GTCGACGTGG 
GAAGGCCGCT GCGCAACCTT GCGTCCCAAT CCTCAGGTGG TCGACCGCTT TACCGATCCG 
CACCGTGCCC TGTCCATCGC GCGTATCGAA TGCCACTACT TCATGAACAA GGCGTTTCTG 
GAAGAGAACC AGCTGATTCG CGACATGCCG AAGATCGCTC ACCTGCCGGC AATCATTGTG 
CACGGTCGTT ACGATGTCAT CTGCCCGCTG GACAATGCCT GGGAGCTGCA TCAGAACTGG 
CCCGACAGCG AGCTGCAGAT CATTCGCGAC GCAGGGCATT CGGCCGCCGA AACCGGTATC 
GCCGATGCGC TGGTACGTGC CGCTGCGCAG ATTGCGCAGA ACCTGCTCGA TCTGCCGCCC 
GAAGAAGCCT GA

Protein sequence

MQTLYPQIKP YARHDLAVEQ PHVLYVDESG SPEGLPVVFI HGGPGSGCDA HSRCYFDPNL 
YRIVTFDQRG CGRSTPHASL ENNTTWKLVE DLEVIREHLG IDKWVLFGGS WGSTLALAYA 
QTHPDRVHAL ILRGVFLARQ QEIDWFYQAG ASRLFPDYWQ DYVAPIPLDE RNNILAAFHK 
RLTGADQIAQ MHAAKAWSTW EGRCATLRPN PQVVDRFTDP HRALSIARIE CHYFMNKAFL 
EENQLIRDMP KIAHLPAIIV HGRYDVICPL DNAWELHQNW PDSELQIIRD AGHSAAETGI 
ADALVRAAAQ IAQNLLDLPP EEA