Gene BURPS668_A2859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2859
Symbol
ID	4887924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2719574
End bp	2721508
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	71%
IMG OID	640132795
Product	x-prolyl-dipeptidyl aminopeptidase
Protein accession	YP_001063851
Protein GI	126444780
COG category	[R] General function prediction only
COG ID	[COG2936] Predicted acyl esterases
TIGRFAM ID	[TIGR00976] putative hydrolase, CocE/NonD family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.208132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTTC ATCGAACCGA ACCGCGTCGC GCCTGGATTG CCGTGCTCGC CGCCGCCGCG 
ACGCTTGCCG CTTGCGGCGG CGATGACGGC GCGGGCGTCC CGGGTGCATC CGCGCTCGCT 
CAGGTCCAGC AGGAGGGAGC CGCGCCGTCC GCGGCCGGCG CACCGCAGCT CGCCGCACGC 
TTCTCGCCGT CCGGCGTGCC GTATGCCAGC CTGTCGAGCG GCGGCCGCTA TCGGCCCGTG 
ATTCAGAACG GGCAGGTGCA GCCGTCGCTG TCGGGCGGCA CGATTGCCGA GGAAGCGTGG 
GTCGAGACGC CCGTCGATTC CGACGGGGAC GGCGCGAAGG ATCGGATTCA CGTGCGCATC 
GTGCGTCCGT CCGAAACCGC GTCGGGCGCG CGCACGCCTG TCATCGTGCT CGCGAGCCCT 
TACTACAACG GGCTGGCCGA TAGCCCGAAC CACAACGTCG ACGTCGAGCT CGACGGCACG 
CCGCATCCCG CCGCTTCGGC GTCCGCGCGA ATCATGGCCG CCGCGCCGCA GACGCGGATC 
TGGCAGCAGC TCGACGCGGC CGCCGCCGGG CGTTCGTGGA TCGAAGGCTA TTTCGTGCCG 
CGCGGCTTCA CGGTCGTGTA CGCGGATTCG CTCGGCACGG CCGGCTCGGA CGGCTGCCCG 
ACGATCCTCA CGCGCGACGA ATCGGTCGCG ATGGCGTCGG TGATCCGCTG GCTCGGGCGC 
GGCGCGGCCG CGAAGGACGC GAACGGCAAG CCGCTCGTCG CGACCTGGTC GACGGGGCAC 
GTCGGCATGT ACGGCGTATC GTACGACGGC ACGCTGCCGA AGATGGTCGC AAGCCTGCGC 
ACGCGCGGGC TCGATGCGAT CGTGCCGGTT GCCGGGCTCA CCGACATGTA CGGCTACTAC 
CGCTCGGGCG GGCTCGTGCG CGCACCCGAC GGCTATCAGG GCGAGGACGT CGACGTCTAC 
ATCAAGGCGC TGCTGACGAA CCCGCATCCG GAGCGCTGCA CGCATCTGAT CGACGAGGCG 
CTGCAGAAGG AGGATCGCAA GACGGGCGAT TATTCGGCGT TCTGGGCGGC GCGCGAGATT 
CCGAGCGCGC TCGCGGTCGC GCCCGCGCTC GTCGCGCAAG GGCTCGCCGA CGACAACGTG 
AGGACCGACC AGTCGACGTC GTGGTATCTC GCGATGCGGC GTCAGGGCGT GCCCACGCAG 
TTGTGGCTGC ACCGCGCGCA CCATACCGAT CCGACCCGCG TGCCCGCGAT GGCCGACGCG 
TGGACCGGGC AGGTGAACCG CTGGTTCACG CGTTATCTGC TCGGCTACGA CAACGGCGTC 
GAGCGCAGCC CGGGCTCGGT GATCGAGCAG TCGGACGGCA CGCTGCTGAA GGAGGCGAGC 
TGGCCCGCGC GCGGCGCATC GTCCGTCACG TATTTCGCGG GCGGCGACGG CGCGGGCACC 
GGCACGCTGC TGACGCAGCC GACGGGCGGC CCGCTCGCGA AGTTCACCGA CGACGCGCGC 
ATCATGGCGC TCGCGCTGGC GAACGCGAAC ACGGGCGAGC ATCGCAGCCG CTTCGAGACG 
GCGCCCGTCG CGAGCGCGAC GCGGCTCTCC GGCACCGCGA CCGCGCGCGT GCGCCTGACG 
TTCTCGGCAA CCGCGAACGT GACCGCGCTG CTGATCGATC GCGCACCGGA CGGCAGCGCG 
ACGATCATCA CCCGCGCGTG GACGGATCCG CGCAACCGTC TGTCGAGCTG GTTCTCGGAG 
CCGGTGTTGC CCGGCATGCC GTACGATCTG CGCCTCGCGT TCATGCCGCG CGACTACCGG 
CTCGAAGCGG GACATCGGCT CGGGCTCGTC GTGCTGTCGA GCGACAACGA GGCGACGCTG 
CGGCCGACGC CGGGCACCGA GCTGACGCTC GATCCGGCCG GCACGAGCGT GACGGTGCCG 
CTGCTTCCGG CTTGA

Protein sequence

MRFHRTEPRR AWIAVLAAAA TLAACGGDDG AGVPGASALA QVQQEGAAPS AAGAPQLAAR 
FSPSGVPYAS LSSGGRYRPV IQNGQVQPSL SGGTIAEEAW VETPVDSDGD GAKDRIHVRI 
VRPSETASGA RTPVIVLASP YYNGLADSPN HNVDVELDGT PHPAASASAR IMAAAPQTRI 
WQQLDAAAAG RSWIEGYFVP RGFTVVYADS LGTAGSDGCP TILTRDESVA MASVIRWLGR 
GAAAKDANGK PLVATWSTGH VGMYGVSYDG TLPKMVASLR TRGLDAIVPV AGLTDMYGYY 
RSGGLVRAPD GYQGEDVDVY IKALLTNPHP ERCTHLIDEA LQKEDRKTGD YSAFWAAREI 
PSALAVAPAL VAQGLADDNV RTDQSTSWYL AMRRQGVPTQ LWLHRAHHTD PTRVPAMADA 
WTGQVNRWFT RYLLGYDNGV ERSPGSVIEQ SDGTLLKEAS WPARGASSVT YFAGGDGAGT 
GTLLTQPTGG PLAKFTDDAR IMALALANAN TGEHRSRFET APVASATRLS GTATARVRLT 
FSATANVTAL LIDRAPDGSA TIITRAWTDP RNRLSSWFSE PVLPGMPYDL RLAFMPRDYR 
LEAGHRLGLV VLSSDNEATL RPTPGTELTL DPAGTSVTVP LLPA