Gene BURPS668_A2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2202
Symbol
ID	4886414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2134032
End bp	2135621
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	72%
IMG OID	640132139
Product	serine protease, kumamolysin
Protein accession	YP_001063196
Protein GI	126445010
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.566013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGGC ATCTTCACGC CGGCAACGAA TCGCATCTCG TCGCCGAATC CACGTGCATC 
GGGCCGTGCG ATCCGGCCGA GACGATTCAT GTAGTGGTGA TGTTGCGGCG ACAGCAAGAG 
CAGCACCTCG ATTCATTGTT GCAGGGCCTC GCGAGCGGCG ATCCGGGCGT GAAGCCTGTC 
TCGCGCGAGG CGTTCGCCCA GCGTTTCGGC GCGCATCCCG ACGACGTCAT GAAAGTCGAG 
GCATTCGCGC AGCAGCGCGG CCTCGCGGTC GCGCGCGTCG ATCCGGTCGA GAGCCTCGTC 
GTGCTGTCGG GCACGATCGC GCAGTTCGAG GCGGCCTTCG GCGTGAAGCT CGAGCGCTTC 
GAGCATCGGT CGATCGGCCA GTATCGCGGC CGCACGGGCG ATATCACGCT GCCCGACGAG 
TTGCACGGCA TCGTCACCGC GGTGCTCGGG CTCGACGATC GCCCGCAGGC CCGGCCGCAT 
TTCCGGCTGC GGCCGACTTT CCTGCCCGCG CGCGCGCCGG CCGTCACCTA CACGCCGCCG 
CAGCTCGCGG CCCTCTACGA TTTCCCGCCC GGCGACGGCG CGGGCCAGTG CATCGCGATC 
GTCGAGCTCG GCGGCGGCTA TCGGCCGGCC GAGATCCAGC AGTATTTCGG CGGCCTCGGG 
CTCGCGCGGC AGCCGAAGCT CGTCGACGTG AGCGTCGGCG CGGGGCGCAA CGCGCCGACG 
GGCGATCCGA GCGGGCCGGA CGGCGAAGTC GCGCTCGATA TCGAGATCGC GGGCGCGATC 
GCGCCCGGCG CGACGATTGC CGTCTATTTC GCGCAGAACA GCGACGCCGG CTTCATCCAG 
GCGGTCAATC AGGCGGTGCA CGACACGACG AACCGGCCCT CCGTCGTGTC GATCAGTTGG 
GGCGCGGCGG AGGCGAACTG GACGTCGCAA TCGATCCAGG CCTTCGATCG CGTGCTGCAG 
TCGGCCGCGG CGCTCGGCGT GACCGTGTGC GCGGCGTCCG GCGATGACGG CTCGAACGAC 
GGCCTGCAGG ACGGCACGAA TCACGTCGAT TTCCCGGCAT CGAGCCCGTA CGTGCTCGCG 
TGCGGCGGCA CGCGGCTCGA CGCGCTGCCG GGGCAGGGCA TCCGCAGCGA AGTGGTGTGG 
AACGACGAGG CGGCGGGCGG CGGCGCGACG GGCGGCGGCG TCAGCGCCGT GTTCGACGTG 
CCGCAGTGGC AGAGCGGCCT GAGCGCGACG CTCGCGCAGG GCGGCGGCGC GTCGCCGCTC 
GTGAAGCGCG GCGTGCCGGA CGTCGCGGGC GATGCGTCGC CCGCGACGGG CTACGAGGTG 
TTCGTCGCGG GCACGTCGAC GGTGATGGGC GGCACGAGCG CCGTCGCACC GCTGTGGGCC 
GCGCTCGTCG CGCGGATCAA TGCGGCGGCG GGCAGCCCCG CGGGCTGGAT CAACCCGAAG 
CTGTACCGGA ACGCGGGCGC GCTGCACGAC ATCTCGGTGG GCGATAACGG CGCGTATGCG 
GCGACGCCGG GCTGGGACGC GTGCACGGGG CTCGGCAGCC CGGACGGCGC GAAGGTCGCG 
GCGGCGCTGA AGGGCGGCGC GGCGGGCTGA

Protein sequence

MARHLHAGNE SHLVAESTCI GPCDPAETIH VVVMLRRQQE QHLDSLLQGL ASGDPGVKPV 
SREAFAQRFG AHPDDVMKVE AFAQQRGLAV ARVDPVESLV VLSGTIAQFE AAFGVKLERF 
EHRSIGQYRG RTGDITLPDE LHGIVTAVLG LDDRPQARPH FRLRPTFLPA RAPAVTYTPP 
QLAALYDFPP GDGAGQCIAI VELGGGYRPA EIQQYFGGLG LARQPKLVDV SVGAGRNAPT 
GDPSGPDGEV ALDIEIAGAI APGATIAVYF AQNSDAGFIQ AVNQAVHDTT NRPSVVSISW 
GAAEANWTSQ SIQAFDRVLQ SAAALGVTVC AASGDDGSND GLQDGTNHVD FPASSPYVLA 
CGGTRLDALP GQGIRSEVVW NDEAAGGGAT GGGVSAVFDV PQWQSGLSAT LAQGGGASPL 
VKRGVPDVAG DASPATGYEV FVAGTSTVMG GTSAVAPLWA ALVARINAAA GSPAGWINPK 
LYRNAGALHD ISVGDNGAYA ATPGWDACTG LGSPDGAKVA AALKGGAAG