Gene BURPS668_3652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3652
Symbol
ID	4883072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3579136
End bp	3580344
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	67%
IMG OID	640129580
Product	serine protease
Protein accession	YP_001060656
Protein GI	126438575
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family [TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAGAC GCTTCTGGCT GTTCTTCGCC CAAGCGGTGA CGGTGCTGCT CGCACTGATG 
TTCATCGTGG CGACGCTCAA GCCGCAATGG CTCCAACGGC AGGGCCAGCT CGGCAAGCAG 
CTCGCGGCGC CGATCGTCGC GCTGCGGGAA GTCGCGCCCG GCGTCGGCGG CGCGCCCGCT 
CAATCCTCGT ATGCGGACGC CGCGCAAAAG GCGATGCCCG CGGTCGTCAA CGTGTTCTCC 
AGCAAGGACG GTTCGCTGCC GCCCGATCCG CGCGCGAAGG ATCCGCTGTT TCGCTATTTC 
TTCGGCGACC GCAACGCGCG CCGGCAGCAG GAGGAACCCG CGGCCAATCT GGGGTCGGGC 
GTCATCGTAA GCTCGGAGGG TTACATTCTA ACGAACCAGC ACGTCGTCGA CGGCGCGGAC 
CAGATCGAAG TCGCGCTCGC CGACGGCCGC ACGGCCACCG CGAAGGTGAT CGGCAGCGAT 
CCGGAAACCG ACCTCGCGGT GCTCAAGATC AACATGACGA ACCTGCCGAC GATCACGCTC 
GGCCGCTCCG ACCAGTCGCG CGTGGGCGAC GTCGTGCTCG CGATCGGCAA CCCGTTCGGG 
GTCGGCCAGA CGGTCACGAT GGGGATCATC AGCGCGCTCG GGCGCAACCA CCTCGGCATC 
AACACGTTCG AGAACTTCAT CCAGACCGAC GCGCCGATCA ACCCGGGCAA TTCGGGCGGC 
GCGCTCGTCG ACGTAAACGG CAACCTGCTC GGCATCAATA CGGCGATCTA CTCGCGCTCG 
GGCGGCTCGC TCGGCATCGG CTTCGCGATC CCCGTGTCGA CCGCGCGCAA CGTGCTCGAG 
AGCATCATCA CGACGGGCAC CGTCACGCGC GGCTGGATCG GCGTCGAGCC GCAGGACGTG 
ACGCCGGAGA TCGCCGAATC GTTCAGCCTT GCGCAAAAAT CGGGCGCGAT CGTTGCGGGC 
GTGCTGCAAG GCGGCCCGGC CGACAAGGCG GGCATCAAGC CGGGCGATAT TCTGATGTTG 
ATCGACGGCG AGGACATCAC CGATACGACG AAGCTGCTGA ACGTCGTCGC GCAGATCAAG 
CCCGGCACGC CGGCGAAGGT TCACGTGGTG CGCAAGGGCA AGGAGCTCGA CGTCACCGTC 
GTGATCGGCA AGCGGCCGCC GCCGCCGAAG CAGGCGCTCG ACGACCAGAA CAGCGACGAG 
GAGGAGTGA

Protein sequence

MLRRFWLFFA QAVTVLLALM FIVATLKPQW LQRQGQLGKQ LAAPIVALRE VAPGVGGAPA 
QSSYADAAQK AMPAVVNVFS SKDGSLPPDP RAKDPLFRYF FGDRNARRQQ EEPAANLGSG 
VIVSSEGYIL TNQHVVDGAD QIEVALADGR TATAKVIGSD PETDLAVLKI NMTNLPTITL 
GRSDQSRVGD VVLAIGNPFG VGQTVTMGII SALGRNHLGI NTFENFIQTD APINPGNSGG 
ALVDVNGNLL GINTAIYSRS GGSLGIGFAI PVSTARNVLE SIITTGTVTR GWIGVEPQDV 
TPEIAESFSL AQKSGAIVAG VLQGGPADKA GIKPGDILML IDGEDITDTT KLLNVVAQIK 
PGTPAKVHVV RKGKELDVTV VIGKRPPPPK QALDDQNSDE EE