Gene BURPS668_3358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3358
Symbol	pepP
ID	4883314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3293860
End bp	3295269
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	72%
IMG OID	640129286
Product	xaa-pro aminopeptidase
Protein accession	YP_001060369
Protein GI	126439525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGAATC AGCCGACCGA ACCCGCCATC GCCCTCGACG TCTACCGCCA GCGCCGCGAC 
CGCGTGCTGG CCTCGCTGCG CGCGCAAGGC GGCGGCGTCG CGATCGTGCC CACCGCACCG 
GAAGTCCCGC GCAATCGCGA CAGCGACTAT CCGTACCGGC ACGACAGCTA CTTCTACTAC 
CTGACGGGCT TCGCCGAGCC CGACGCGCTG CTCGTCCTCG ACGCGTCGGC GGCCGGCGAC 
GCGCCGCGCT CGATCCTGTT CTGCCGCGCG AAGAATCCCG AGCGAGAAAT CTGGGAAGGG 
TTCCATTTCG GGCCCGAAGG CGCGCGCGAT GCGTTCGGCT TCGACGCCGC GTTCCCGTAC 
GACGCGCTCG ATGCCGAAAT GCCGCGCATC GTCGCCGACG CGCCCGCGCT CCACTACCGC 
TTCGGCGTGT CGGCCGCTTT CGACGCGCGC CTGAACGGCT GGCTCGACGC GGTGCGCGCG 
CGTGCGCGCG CCGGCGTCGC CGCGCCGGGC GCCGCGTTCG ATCTCGGGCC GCTCCTCGAT 
GACATGCGGC TCGTCAAGGA TGCGCACGAG CAGGCAACGA TGCGCCGCGC GGCCGACATC 
TCCGCGCTCG CGCACCGCCG CGCGATGGCC GCGTGCCGCC CCGGCATCCG CGAATACGAA 
CTCGAGGCCG AGCTGCTCTA CACGTTCCGC CGCCACGGCG CGCAATCGCC CGCATACGGC 
TCGATCGTCG CGACGGGCGC GAACGCATGC GTGCTCCACT ATCCGGCCGG CAACGCCGTC 
GTCGCCGACG GCGAGCTCGT GCTGATCGAC GCCGCGTGCG AGCTCGACGG CTACGCATCC 
GACATCACCC GCACGTTTCC GGCGAACGGC CGCTTCTCGG GCCCGCAACG CGCGCTTTAT 
GGCATCGTGC TCGCCGCTCA GGAAGCGGCG ATCGCGGCGA CGCGCGCCGG CACGCCGTTC 
GACGCGCCGC ACGACGCGGC GGTGCGCGTG CTCGCGCAGG GCATGCTCGA CACGGGGCTC 
GTGCCGAAGA CGCGCTTCGC GAGCGTCGAC GACGTGATCG CCGAGCGTGC GTACACGCGC 
TTCTACATGC ACCGCACCGG CCACTGGCTC GGCATGGACG TGCACGACTG CGGCGACTAC 
CGCGAGCGCG CCGCGCCGCG CGACGACGAC GGCGCGCTGC CCTCGCGCGT GCTGCATCCG 
GGCATGGCGC TCACGATCGA GCCGGGGCTG TACGTGCGCC CGGGCGAAGA CGTGCCGCAG 
GCGTTCTGGA ACATCGGCAT CCGCATCGAG GACGACGCGT TCGTCACGCC GACGGGGTGC 
GAGCTGATCA CGCGCGGCGT GCCGGTGGCG GCCGACGAGA TCGAGGCATT GATGCGCGAC 
GCGCGGCCGG CGCCGCGCCC GCAGCCGTGA

Protein sequence

MMNQPTEPAI ALDVYRQRRD RVLASLRAQG GGVAIVPTAP EVPRNRDSDY PYRHDSYFYY 
LTGFAEPDAL LVLDASAAGD APRSILFCRA KNPEREIWEG FHFGPEGARD AFGFDAAFPY 
DALDAEMPRI VADAPALHYR FGVSAAFDAR LNGWLDAVRA RARAGVAAPG AAFDLGPLLD 
DMRLVKDAHE QATMRRAADI SALAHRRAMA ACRPGIREYE LEAELLYTFR RHGAQSPAYG 
SIVATGANAC VLHYPAGNAV VADGELVLID AACELDGYAS DITRTFPANG RFSGPQRALY 
GIVLAAQEAA IAATRAGTPF DAPHDAAVRV LAQGMLDTGL VPKTRFASVD DVIAERAYTR 
FYMHRTGHWL GMDVHDCGDY RERAAPRDDD GALPSRVLHP GMALTIEPGL YVRPGEDVPQ 
AFWNIGIRIE DDAFVTPTGC ELITRGVPVA ADEIEALMRD ARPAPRPQP