Gene BURPS1710b_A0608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0608
Symbol	scpA
ID	3693715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	800185
End bp	801918
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	71%
IMG OID	637730862
Product	kumamolisin
Protein accession	YP_335767
Protein GI	76817289
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTTTACA CTTGCTTTGC CGTACTGTCG CACGCTCCCC ATGGCGGCGT GTGTGCGCCG 
TCCGACATAC CGCCCGGAAC TGCGATCGCG CGACCGTGTC CGAATCCTGG CAATCCGTCA 
CCACGGCTTC TGGAGGGTCC GAATATGGCA AGGCATCTTC ACGCCGGCAA CGAATCGCAT 
CTCGTCGCCG AATCCACGTG CATCGGGCCG TGCGATCCGG CCGAGACGAT TCATGTAGTG 
GTGATGTTGC GGCGACAGCA AGAGCAGCAC CTCGATTCAT TGTTGCAGGG CCTCGCGAGC 
GGCGATCCGG GCGTGAAGCC TGTCTCGCGC GAGGCGTTCG CCCAGCGTTT CGGCGCGCAT 
CCCGACGACG TCATGAAAGT CGAGGCATTC GCGCAGCAGC GCGGCCTCGC GGTCGCGCGC 
GTCGATCCGG TCGAGAGCCT CGTCGTGCTG TCGGGCACGA TCGCGCAGTT CGAGGCGGCC 
TTCGGCGTGA AGCTCGAGCG CTTCGAGCAT CGGTCGATCG GCCAGTATCG CGGCCGCACG 
GGCGATATCA CGCTGCCCGA CGAGTTGCAC GGCATCGTCA CCGCGGTGCT CGGGCTCGAC 
GATCGCCCGC AGGCCCGGCC GCATTTCCGG CTGCGGCCGA CTTTTCTGCC CGCGCGCGCG 
CCGGCCGTCA CCTACACGCC GCCGCAGCTC GCGGCCCTCT ACGATTTCCC GCCCGGCGAC 
GGCGCGGGCC AGTGCATCGC GATCGTCGAG CTCGGCGGCG GCTATCGGCC GGCCGAGATC 
CAGCAGTATT TCGGCGGCCT CGGGCTCGCG CGGCAGCCGA AGCTCGTCGA CGTGAGCGTC 
GGCGCGGGGC GCAACGCGCC GACGGGCGAT CCGAGCGGGC CGGACGGCGA AGTCGCGCTC 
GATATCGAGA TCGCGGGCGC GATCGCGCCC GGCGCGACGA TTGCCGTCTA TTTCGCGCAG 
AACAGCGACG CCGGCTTCAT CCAGGCGGTC AATCAGGCGG TGCACGACAC GACGAACCGG 
CCCTCCGTCG TGTCGATCAG TTGGGGCGCG GCGGAGGCGA ACTGGACGTC GCAATCGATC 
CAGGCCTTCG ATAGCGTGCT GCAGTCGGCC GCGGCGCTCG GCGTGACCGT GTGCGCGGCG 
TCCGGCGATG ACGGCTCGAA CGACGGCCTG CAGGACGGCA CGAATCACGT CGATTTCCCG 
GCATCGAGCC CGTACGTGCT CGCGTGCGGC GGCACGCGGC TCGACGCGCT GCCGGGGCAG 
GGCATCCGCA GCGAAGTCGT GTGGAACGAC GAGGCGGCGG GCGGCGGCGC GACGGGCGGC 
GGCGTCAGCG CCGTGTTCGA CGTGCCGCAG TGGCAGAGCG GCCTGAGCGC GACGCTCGCG 
CAGGGTGGCG GCGCGTCGCC GCTCGCGAAG CGCGGCGTGC CGGACGTCGC GGGCGATGCG 
TCGCCCGCGA CGGGCTACGA GGTGTTCGTC GCGGGCACGT CGACGGTGAT GGGCGGCACG 
AGCGCCGTCG CACCGCTGTG GGCCGCGCTC GTCGCGCGGA TCAATGCGGC GGCGGGCAGC 
CCCGCGGGCT GGATCAACCC GAAGCTGTAC CGGAACGCGG GCGCGCTGCA CGACATCTCG 
GTGGGCGATA ACGGCGCGTA TGCGGCGACG CCGGGCTGGG ACGCGTGCAC GGGGCTCGGC 
AGCCCGGACG GCGCGAAGGT CGCGGCGGCG CTGAAAGGCG GCGCGGCGGG CTGA

Protein sequence

MLYTCFAVLS HAPHGGVCAP SDIPPGTAIA RPCPNPGNPS PRLLEGPNMA RHLHAGNESH 
LVAESTCIGP CDPAETIHVV VMLRRQQEQH LDSLLQGLAS GDPGVKPVSR EAFAQRFGAH 
PDDVMKVEAF AQQRGLAVAR VDPVESLVVL SGTIAQFEAA FGVKLERFEH RSIGQYRGRT 
GDITLPDELH GIVTAVLGLD DRPQARPHFR LRPTFLPARA PAVTYTPPQL AALYDFPPGD 
GAGQCIAIVE LGGGYRPAEI QQYFGGLGLA RQPKLVDVSV GAGRNAPTGD PSGPDGEVAL 
DIEIAGAIAP GATIAVYFAQ NSDAGFIQAV NQAVHDTTNR PSVVSISWGA AEANWTSQSI 
QAFDSVLQSA AALGVTVCAA SGDDGSNDGL QDGTNHVDFP ASSPYVLACG GTRLDALPGQ 
GIRSEVVWND EAAGGGATGG GVSAVFDVPQ WQSGLSATLA QGGGASPLAK RGVPDVAGDA 
SPATGYEVFV AGTSTVMGGT SAVAPLWAAL VARINAAAGS PAGWINPKLY RNAGALHDIS 
VGDNGAYAAT PGWDACTGLG SPDGAKVAAA LKGGAAG