Gene BURPS668_A0373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0373
Symbol	pip
ID	4887321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	337787
End bp	338725
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	69%
IMG OID	640130314
Product	proline iminopeptidase
Protein accession	YP_001061379
Protein GI	284159997
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTATCCAC CGATCGAACC TTATGCACAC GGCTTCCTCG ATACCGGCGA CGGCCATCGC 
GTGTACTGGG AGCTGTGCGG CAACCCCAAC GGCAAGCCGG CCGTCTTCCT GCACGGCGGC 
CCCGGCAGCG GCTGCAGCGC CGATCACCGT CGCCTCTTCG ATCCCGCGCG CTACAACGTG 
CTGCTGTTCG ACCAGCGCGG CTGCGGCCGC TCGACGCCGC ACGCGAGCCT CGAGAACAAC 
ACGACATGGC ATCTCGTCGA CGACATCGAG CGGCTGCGCG CGATGCTCGG CGTCGAGCGC 
TGGCTCGTGT TCGGCGGCTC GTGGGGCAGC GCGCTCGCGC TCGCATATGC GCAAACGCAC 
CCGGCGCGCG TGGCCGAGCT CGTCGTGCGC GGCATCTTCA CGGTGCGCCG GTCCGAGCTG 
CTCTGGTACT ACCAGGAAGG CGCGTCGTGG CTGTTTCCGG ATCTGTGGGA AGACTTCATC 
GCGCCCATTC CGCGCGCCGA GCGCGCGGAT CTGATCGCCG CGTATCGCCG CCGGCTGACG 
GGCGACGACG AGGCGGCCAA GCGCGAGGCC GCGCGCGCGT GGAGCGTCTG GGAGGGCCGG 
ACGATCGCGC TGCTGCCGAA CGCCGCGCAC GAAACGTATT TCGGCGACGC GCATTTCGCG 
CTCGCGTTCG CCCGCATCGA AAACCACTAC TTCGTTCATC AAGGTTTCAT GGAAGACGGG 
CAGTTGCTGC GCGATGCGCA TCGTCTCGCG GACATCCCGG GCGTGATCGT TCAGGGGCGC 
TACGACGTCG CGACGCCGGC GCGCACCGCG TGGGAACTCG CGAAGGCGTG GCCGCGCGCG 
TCGCTCGAGA TCGTGCCCGA CGCGGGCCAC GCATACGACG AGCCGGGCAT TCTGCGCGCG 
CTGATCGCGG CGACCGACCG CTTCGCGCGC GAGCGCTGA

Protein sequence

MYPPIEPYAH GFLDTGDGHR VYWELCGNPN GKPAVFLHGG PGSGCSADHR RLFDPARYNV 
LLFDQRGCGR STPHASLENN TTWHLVDDIE RLRAMLGVER WLVFGGSWGS ALALAYAQTH 
PARVAELVVR GIFTVRRSEL LWYYQEGASW LFPDLWEDFI APIPRAERAD LIAAYRRRLT 
GDDEAAKREA ARAWSVWEGR TIALLPNAAH ETYFGDAHFA LAFARIENHY FVHQGFMEDG 
QLLRDAHRLA DIPGVIVQGR YDVATPARTA WELAKAWPRA SLEIVPDAGH AYDEPGILRA 
LIAATDRFAR ER