Gene BURPS1106A_3394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3394
Symbol	pepP
ID	4901368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3311703
End bp	3313112
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	72%
IMG OID	640136620
Product	xaa-pro aminopeptidase
Protein accession	YP_001067631
Protein GI	126451784
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGAATC AGCCGACCGA ACCCGCCCTC GCCCTCGACG TCTACCGCCA GCGCCGCGAC 
CGCGTGCTGG CCTCGCTGCG CGCGCAAGGC GGCGGCGTCG CGATCGTGCC CACCGCACCG 
GAAGTCCCGC GCAATCGCGA CAGCGACTAT CCGTACCGGC ACGACAGCTA CTTCTACTAC 
CTGACGGGCT TCGCCGAGCC CGACGCGCTG CTCGTCCTCG ACGCGTCGGC GGCCGGCGAC 
GCGCCGCGCT CGATCCTGTT CTGCCGCGCG AAGAATCCCG AGCGAGAAAT CTGGGAAGGG 
TTCCATTTCG GGCCCGAAGC CGCGCGCGAT GCGTTCGGCT TCGACGCCGC GTTCCCGTAC 
GACGCGCTCG ACGCCGAAAT GCCGCGCATC GTCGCCGACG CGCCCGCGCT CCACTACCGC 
TTCGGCGTGT CGGCCGCTTT CGACGCGCGC CTGAACGGCT GGCTCGACGC GGTGCGCGCG 
CGTGCGCGCG CCGGCGTCGC CGCGCCGGGC GCCGCGTTCG ATCTCGGGCC GCTCCTCGAT 
GACATGCGGC TCGTCAAGGA TGCGCACGAG CAGGCAACGA TGCGCCGCGC GGCCGACATC 
TCCGCGCTCG CGCACCGCCG CGCGATGGCC GCGTGCCGCC CCGGCATCCG CGAATACGAA 
CTCGAGGCCG AGCTGCTCTA CACGTTCCGC CGCCACGGCG CGCAATCGCC CGCATACGGC 
TCGATCGTCG CGACGGGCGC GAACGCATGC GTGCTCCACT ATCCGGCCGG CAACGCCGTC 
GTCGCCGACG GCGAGCTCGT GCTGATCGAC GCCGCGTGCG AGCTCGACGG CTACGCATCC 
GACATCACCC GCACGTTCCC GGCGAACGGC CGCTTCTCGG GCCCGCAACG CGCGCTTTAT 
GACATCGTGC TCGCCGCTCA GGAAGCGGCG ATCGCGGCGA CGCGCGCCGG CACGCAGTTC 
GACGCGCCGC ACGACGCGGC GGTGCGCGTG CTCGCGCAGG GCATGCTCGA CACGGGGCTC 
GTGCCGAAGA CGCGCTTCGC GAGCGTCGAC GACGTGATCG CCGAGCGTGC GTACACGCGC 
TTCTACATGC ACCGCACCGG CCACTGGCTC GGCATGGACG TGCACGACTG CGGCGACTAC 
CGCGAGCGCG GCGCGCCGCG CGACGACGAC GGCGCGCTGC CCTCGCGCGT GCTGCATCCG 
GGCATGGCGC TCACGATCGA GCCGGGGCTG TACGTGCGCC CGGGCGAAGA CGTGCCGCAG 
GCGTTCTGGA ACATCGGCAT CCGCATCGAG GACGACGCGT TCGTCACGCC GACGGGGTGC 
GAGCTGATCA CGCGCGGCGT GCCGGTGGCG GCCGACGAGA TCGAGGCATT GATGCGCGAC 
GCGCGGCCGG CGCCGCGCCC GCAGCCGTGA

Protein sequence

MMNQPTEPAL ALDVYRQRRD RVLASLRAQG GGVAIVPTAP EVPRNRDSDY PYRHDSYFYY 
LTGFAEPDAL LVLDASAAGD APRSILFCRA KNPEREIWEG FHFGPEAARD AFGFDAAFPY 
DALDAEMPRI VADAPALHYR FGVSAAFDAR LNGWLDAVRA RARAGVAAPG AAFDLGPLLD 
DMRLVKDAHE QATMRRAADI SALAHRRAMA ACRPGIREYE LEAELLYTFR RHGAQSPAYG 
SIVATGANAC VLHYPAGNAV VADGELVLID AACELDGYAS DITRTFPANG RFSGPQRALY 
DIVLAAQEAA IAATRAGTQF DAPHDAAVRV LAQGMLDTGL VPKTRFASVD DVIAERAYTR 
FYMHRTGHWL GMDVHDCGDY RERGAPRDDD GALPSRVLHP GMALTIEPGL YVRPGEDVPQ 
AFWNIGIRIE DDAFVTPTGC ELITRGVPVA ADEIEALMRD ARPAPRPQP