Gene BMASAVP1_0886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_0886
Symbol	pip
ID	4677753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008784
Strand	-
Start bp	896505
End bp	897794
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	70%
IMG OID	639843406
Product	proline iminopeptidase
Protein accession	YP_990486
Protein GI	121598052
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.424986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCGC GCGTCGAGCC GGCGCCCGCG CGCGCAAGCA TTCATGCATG CATCCATGCG 
TCGATGCATT CGTGCGCGCC TTCGGCAGTC GACGCGCCAC GCCGCGCCGC GACGAACGGC 
GCGCGAGGCG GCCGGGCGGC GGCTCGGCCA CCTCCGGTGC AATTGCGTCC CCGCGTTTTC 
CGGCGACTCG GCATAATGAA GCGTCGCTTT CGTCGCCGGC GCCGCATCGG CGCGAGCCAA 
CGCGGCCGGC GCATCGCATG GGGCGCACGC ATGCGCCGCG CGGCCGTTCC ATTCGTCGCG 
TTCGGCGAGG CGCCCCCAGT CGTCTTCTTC CATTCAACCG GAGCGTCTCT CTTGTATCCA 
CCGATCGAAC CTTATGCACA CGGCTTCCTC GATACCGGCG ACGGCCATCG CGTGTACTGG 
GAGCTGTGCG GCAACCCCAA CGGCAAGCCG GCCGTCTTCC TGCACGGCGG CCCCGGCAGC 
GGCTGCAGCG CCGATCACCG TCGCCTCTTC GATCCCGCGC GCTACAACGT GCTGCTGTTC 
GACCAACGCG GCTGCGGCCG CTCGACGCCG CACGCGAGCC TCGAGAACAA CACGACATGG 
CACCTCGTCG ACGACATCGA GCGGCTGCGC GCGATGCTCG GCGTCGAGCG CTGGCTCGTG 
TTCGGCGGCT CGTGGGGCAG CGCGCTCGCG CTCGCATATG CGCAAACGCA CCCGGCGCGC 
GTGGCCGAGC TCGTCGTGCG CGGCATCTTC ACGGTGCGCC GGTCCGAGCT GCTCTGGTAC 
TACCAGGAAG GCGCGTCGTG GCTGTTTCCG GATCTGTGGG AAGACTTCAT CGCGCCCATT 
CCGAGCGCCG AGCGCGCGGA TCTGATCGCC GCGTATCGCC GCCGGCTGAC GGGCGACGAC 
GAGGCGGCCA AGCGCGAGGC CGCGCGCGCG TGGAGCGTCT GGGAGGGCCG GACGATCGCG 
CTGCTGCCGA ACGCCGCGCA CGAAACGTAT TTCGGCGACG CGCATTTCGC GCTCGCGTTC 
GCCCGCATCG AAAACCACTA CTTCGTTCAT CAAGGTTTCA TGGAAGACGG GCAGTTGCTG 
CGCGATGCGC ATCGTCTCGC GGACATCCCG GGCGTGATCG TTCAGGGGCG CTACGACGTC 
GCGACGCCGG CGCGCACCGC GTGGGAACTC GCGAAGGCGT GGCCGCGCGC GTCGCTCGAG 
ATCGTGCCCG ACGCGGGCCA CGCATACGAC GAGCCGGGCA TTCTGCGCGC GCTGATCGCG 
GCGACCGACC GCTTCGCGCG CGAGCGCTGA

Protein sequence

MRARVEPAPA RASIHACIHA SMHSCAPSAV DAPRRAATNG ARGGRAAARP PPVQLRPRVF 
RRLGIMKRRF RRRRRIGASQ RGRRIAWGAR MRRAAVPFVA FGEAPPVVFF HSTGASLLYP 
PIEPYAHGFL DTGDGHRVYW ELCGNPNGKP AVFLHGGPGS GCSADHRRLF DPARYNVLLF 
DQRGCGRSTP HASLENNTTW HLVDDIERLR AMLGVERWLV FGGSWGSALA LAYAQTHPAR 
VAELVVRGIF TVRRSELLWY YQEGASWLFP DLWEDFIAPI PSAERADLIA AYRRRLTGDD 
EAAKREAARA WSVWEGRTIA LLPNAAHETY FGDAHFALAF ARIENHYFVH QGFMEDGQLL 
RDAHRLADIP GVIVQGRYDV ATPARTAWEL AKAWPRASLE IVPDAGHAYD EPGILRALIA 
ATDRFARER