Gene BURPS1106A_0496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0496
Symbol
ID	4900921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	462180
End bp	463772
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	66%
IMG OID	640133726
Product	carboxyl-terminal protease
Protein accession	YP_001064779
Protein GI	126454825
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATGA AATTGAAGAA CATCGGCCTG ATTGCCGCGG GCCTCGCGAC TGGCGTCTTC 
GCGACGCTGC AAATCTCCGC GTCGGCCCAG CAGGCCGTCA CGACGGCCGC CGCGCCGCTG 
CCGCTCGACC AGTTGCGGCT CTTCGCCGAA GTGTTCGGGC AGATCAAGCG CGAATACGTC 
GAGCCCGTCG ACGACAAGAA GCTGCTGACC GCGGCGATCA AGGGCATGGT GTCGAGCCTC 
GATCCGCACT CGTCGTACCT CGACAAGACC GATTACCAGG AACTGCAGGA GCAGACGAAG 
GGCCGCTTCG CCGGCCTCGG CATCGAGATT TCGCAGGAAG ACGGCCTCGT CAAGGTGATC 
TCGCCGATCG AGGACACGCC CGCGTTCCGC GCCGGCATCC GTCCGGGCGA CCTGATCACC 
CGCATCAACG ATCGCCCGGT GCGCGGCATG ACGCTCGACA AGGCGGTCAA GCAGATGCGC 
GGCGAGCCCG GCACGAAGGT CACGCTGACG ATCTTCCGCA AGAGCGACGA CCGCACGTTC 
CCCGTCACGG TCACGCGCGC GGTGATCCGC GTGCAGAGCG TGAAGATGAA GCTGCTCGAT 
CCGGGCTACG CGTACATCCG CATCACGAGC TTCCAGGAGC GCACGACGCC CGATCTCGCC 
GCGAAGCTGC AGGACATCGC GCGCCAGCAG CCGAACCTGA AGGGCCTGAT CCTCGATCTG 
CGCAACAACG GCGGCGGCCT GCTGCAAAGC GCCGTCGGCG TCGCGGGCGC GTTCCTGCCT 
CCGGATTCCG TCGTCGTGTC GACGAACGGC CAGATCCCCG ATTCGAAGCA GATCTACCGC 
GACAACTACG AGAACTACCG CCTGCCGTCG TTCGACTCCG ATCCGCTGAA GAACCTGCCC 
GCCGTCTTCA AGACGGTGCC GATGATCGTG CTGACGAACG CGTATTCGGC GTCGGCCTCG 
GAGATCGTCG CGGGCGCGCT GCAGGATTCG CACCGTGCGG TGATCATGGG CAAGGCGACG 
TTCGGCAAGG GCTCGGTGCA GACGGTGCGG CCGATGACGG CCGATTCCGC GCTGCGCCTG 
ACGACCGCGT ACTACTACAC GCCGAGCGGC CGCTCGATCC AGAACAAGGG CATCCTGCCC 
GACATTCCGG TCGATCAGTA CGCGGACGGC GATCCGGACG ACGTGCTCGT CACGCGCGAG 
GTCGATTACA CGAACCACCT CGCGAACACG CAGGATCCGA ACGAGAAGAA GGAGCTCGAG 
GAACGCGAGC AGCGCCGGAT GGAGCAGTTG CGCATCCTCG AGGAGCAGAA CGACAAGAAG 
ACGCCCGAGC AGCGTCAGAA GGATCGCGAG CGCAAGCCGA TCGAATTCGG CAGCGCCGAC 
GATTTCATGA TGCAGCAGGC GCTCAACAAG CTCGAAGGCA AGCCGGTCGA GCAGTCGAAG 
ATGATCGCCG CCGACAGCAC CGCGAAGAGC GCCGCCGCCA AGGCGGGCAC CGCCTCGGCG 
GCGAAGGGCG CGTCGGGCGC GGCGGCCAAG CCCGCGTCGG CTGCCAAGCC CGCGTCGGCA 
GCCAAGCCGG TGTCGGCGCC GCAACCGCAG TAA

Protein sequence

MRMKLKNIGL IAAGLATGVF ATLQISASAQ QAVTTAAAPL PLDQLRLFAE VFGQIKREYV 
EPVDDKKLLT AAIKGMVSSL DPHSSYLDKT DYQELQEQTK GRFAGLGIEI SQEDGLVKVI 
SPIEDTPAFR AGIRPGDLIT RINDRPVRGM TLDKAVKQMR GEPGTKVTLT IFRKSDDRTF 
PVTVTRAVIR VQSVKMKLLD PGYAYIRITS FQERTTPDLA AKLQDIARQQ PNLKGLILDL 
RNNGGGLLQS AVGVAGAFLP PDSVVVSTNG QIPDSKQIYR DNYENYRLPS FDSDPLKNLP 
AVFKTVPMIV LTNAYSASAS EIVAGALQDS HRAVIMGKAT FGKGSVQTVR PMTADSALRL 
TTAYYYTPSG RSIQNKGILP DIPVDQYADG DPDDVLVTRE VDYTNHLANT QDPNEKKELE 
EREQRRMEQL RILEEQNDKK TPEQRQKDRE RKPIEFGSAD DFMMQQALNK LEGKPVEQSK 
MIAADSTAKS AAAKAGTASA AKGASGAAAK PASAAKPASA AKPVSAPQPQ