Gene BURPS1106A_A0279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0279
Symbol	pip
ID	4906027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	268625
End bp	269914
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	70%
IMG OID	640143386
Product	proline iminopeptidase
Protein accession	YP_001074322
Protein GI	126455681
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.237584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCGC GCGTCGAGCC GGCGCCCGCG CGCGCAAGCA TTCATGCATG CATCCATGCG 
TCGATGCATT CGTGCGCGCC TTCGGCAGTC GACGCGCCAC GCCGCGCCGC GACGAACGGC 
GCGCGAGGCG GCCGGGCGGC GGCTCGGCCA CCTCCGGTGC AATTGCGTCC CCGCGTTTTC 
CGGCGACTCG GCATAATGAA GCGTCGCTTT CGTCGCCGGC GCCGCATCGG CGCGAGCCAA 
CGCGGCCGGC GCATCGCATG GGGCGCACGC ATGCGCCGCG CGGCCGTTCC ATTCGTCGCG 
TTCGGCGAGG CGCCCCCAGT CGTCTTCTTC CATTCAACCG GAGCGTCTCT CTTGTATCCA 
CCGATCGAAC CTTATGCACA CGGCTTCCTC GATACCGGCG ACGGCCATCG CGTGTACTGG 
GAGCTGTGCG GCAACCCCAA CGGCAAGCCG GCCGTCTTCC TGCACGGCGG CCCCGGCAGC 
GGCTGCAGCG CCGATCACCG TCGCCTCTTC GATCCCGCGC GCTACAACGT GCTGCTGTTC 
GACCAACGCG GCTGCGGCCG CTCGACGCCG CACGCGAGCC TCGAGAACAA CACGACATGG 
CACCTCGTCG ACGACATCGA GCGGCTGCGC GCGATGCTCG GCGTCGAGCG CTGGCTCGTG 
TTCGGCGGCT CGTGGGGCAG CGCGCTCGCG CTCGCATATG CGCAAACGCA CCCGGCGCGC 
GTGGCCGAGC TCGTCGTGCG CGGCATCTTC ACGGTGCGCC GGTCCGAGCT GCTCTGGTAC 
TACCAGGAAG GCGCGTCGTG GCTGTTTCCG GATCTGTGGG AAGACTTCAT CGCGCCCATT 
CCGAGCGCCG AGCGCGCGGA TCTGATCGCC GCGTATCGCC GCCGGCTGAC GGGCGACGAC 
GAGGCGGCCA AGCGCGAGGC CGCGCGCGCG TGGAGCGTCT GGGAGGGCCG GACGATCGCG 
CTGCTGCCGA ACGCCGCGCA CGAAACGTAT TTCGGCGACG CGCATTTCGC GCTCGCGTTC 
GCCCGCATCG AAAACCACTA CTTCGTTCAT CAAGGCTTCA TGGAAGACGG GCAGTTGCTG 
CGCGATGCGC ATCGTCTCGC GGACATCCCG GGCGTGATCG TTCAGGGGCG CTACGACGTC 
GCGACGCCGG CGCGCACCGC GTGGGAACTC GCGAAGGCGT GGCCGCGCGC GTCGCTCGAG 
ATCGTGCCCG ACGCGGGCCA CGCATACGAC GAGCCGGGCA TTCTGCGCGC GCTGATCGCG 
GCGACCGACC GCTTCGCGCG CGAGCGCTGA

Protein sequence

MRARVEPAPA RASIHACIHA SMHSCAPSAV DAPRRAATNG ARGGRAAARP PPVQLRPRVF 
RRLGIMKRRF RRRRRIGASQ RGRRIAWGAR MRRAAVPFVA FGEAPPVVFF HSTGASLLYP 
PIEPYAHGFL DTGDGHRVYW ELCGNPNGKP AVFLHGGPGS GCSADHRRLF DPARYNVLLF 
DQRGCGRSTP HASLENNTTW HLVDDIERLR AMLGVERWLV FGGSWGSALA LAYAQTHPAR 
VAELVVRGIF TVRRSELLWY YQEGASWLFP DLWEDFIAPI PSAERADLIA AYRRRLTGDD 
EAAKREAARA WSVWEGRTIA LLPNAAHETY FGDAHFALAF ARIENHYFVH QGFMEDGQLL 
RDAHRLADIP GVIVQGRYDV ATPARTAWEL AKAWPRASLE IVPDAGHAYD EPGILRALIA 
ATDRFARER