Gene BURPS668_1641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1641
Symbol
ID	4884144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1609357
End bp	1610913
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	72%
IMG OID	640127568
Product	peptidase s1, chymotrypsin:pdz/dhr/glgf
Protein accession	YP_001058681
Protein GI	126438778
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.554784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCTCGTC AAACGCTTGG CCGCGCCCTG ATTCACGTTG CAGCGCTCGG GGCGGTGCTT 
GTCGGCTTCG CTTGCCTGCA GCCGACGCCA CTCGCCGCGG GTACGCTGCA ATCGCCGGCG 
AAGGCGAAGC GAATCGCGCA GATCGGCGCC GCGGGGCCGG TCGATTTTCC CACGCTCGTC 
GAGCGATACG GGCCCGCCGT CGTCAGCGTG AGCGTGCCTG CGCAGGATCC GCAGATGTCG 
GCGTCCGGCC TCGAGGCGCT CGATCCCGAC GATCCGTTCT TCGCCTACTT CAAATCCGCC 
GCCACGCAGC CCGCGCTGTC GCCGGAGAGC GGGCCGCGCG CGATGGCGGG CGCCGGATCC 
GGTTTTATCG TCGGCGCGGA CGGGATCATC CTGACGACCG CGTACGTGGT CGGGCAGGCG 
AGCGAGGCGA CGGTTCGCCT GATCGACCGG CGCGAATTCA AGGCGCGGGT GCTGGCCGTC 
GATGATTCGA GCGATGTGGC CGTGTTGCAG ATCGACGCGA CGAAGCTGCC GACGGTGCGG 
CTCGGCGATT CGTCCCGGGT GCGCACGGGC GAGCCGGTGC TGACGATCGG CACGCCGGAC 
GGCTCGGCGA ACACGGTGAC GACGGGCATC GTCAGCGCGA CGGCGCGCAT GTTGCCCGAC 
GGCGGCCGCT TTCCGTTCTT TCAGACCGAC GTGACCGGCA ACCTCGACAA CTCGGGCGGC 
CCGGTGTTCA ACCGCGCGGG CGAGGTGATC GGCATCGACG TGCAGATCTA CGGCAGCGGC 
GAGCGCAATC CGGGCGTGAC GTTTGCGATT CCGATCGACA TGGCGATGAA GGTGCGTGCG 
CAGGTGCTGC AGGCGCAGCG CCAGGCGCGA CAGCAGGCGC AGCCGCCGAT GCAACAGGCG 
CAACAGGCGC AACAAGCGCC GCCCGCGGCG GCGCAGAACG CGCTGGGCGT CGACGCGCAG 
GACGTCGGTC CGGGGCTCGC GGCGGCGTTC GGCCTGCCGC GGCCGGCGGG CGCGCTTGTC 
AATGCAGTGG AGCCGGGGTC GCCGGCGGCG GCGGTCGGGC TGAAGCCGGG CGACGTGATC 
GTGCAGATCG GCGATCGGCC GCTCGGCCGC TCGGCGGAAC TGGCCGGCGA CCTCGCGGCG 
CTGCCGCCCG GGGCGAGCGC GCCGATCACG CTGATCCGCA ACCGGATGCC GATGACGGTG 
ATGCTCGGCT CCGGCGCGGC CGCGAGCGCG CCGACAGGCG CGACCGCATC GCCGGGCAAT 
GCGGCCGCCG GCCGCAGCGA GACGGGCGGC GCGGACCGCC TGGGCCTGAC GATGCATCCG 
CTGACGGACG ACGAGCGGCG CTCGACGGGA TTGCCCGTCG GCATGGTGGT CGATGCGGTG 
CGCGGGCCGG CGGCGAACGC GGGGATTCGG CCGGGCGACG TCGTGCTGGA GCTCGACGAT 
ACGCTGATCG AGACGCCGGA CATGGTGCCG GCGCTGGAGG CGAAGGCGGG GAAGGTGGTT 
GCGGTGCTGA TTCAGCGGGG GAGCGAGCGC AGGTTCGTGT CGGTGAAGGC GCGGTGA

Protein sequence

MSRQTLGRAL IHVAALGAVL VGFACLQPTP LAAGTLQSPA KAKRIAQIGA AGPVDFPTLV 
ERYGPAVVSV SVPAQDPQMS ASGLEALDPD DPFFAYFKSA ATQPALSPES GPRAMAGAGS 
GFIVGADGII LTTAYVVGQA SEATVRLIDR REFKARVLAV DDSSDVAVLQ IDATKLPTVR 
LGDSSRVRTG EPVLTIGTPD GSANTVTTGI VSATARMLPD GGRFPFFQTD VTGNLDNSGG 
PVFNRAGEVI GIDVQIYGSG ERNPGVTFAI PIDMAMKVRA QVLQAQRQAR QQAQPPMQQA 
QQAQQAPPAA AQNALGVDAQ DVGPGLAAAF GLPRPAGALV NAVEPGSPAA AVGLKPGDVI 
VQIGDRPLGR SAELAGDLAA LPPGASAPIT LIRNRMPMTV MLGSGAAASA PTGATASPGN 
AAAGRSETGG ADRLGLTMHP LTDDERRSTG LPVGMVVDAV RGPAANAGIR PGDVVLELDD 
TLIETPDMVP ALEAKAGKVV AVLIQRGSER RFVSVKAR