Gene BURPS1106A_A2358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2358
Symbol
ID	4904687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2333815
End bp	2335503
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	66%
IMG OID	640145463
Product	sedolisin
Protein accession	YP_001076391
Protein GI	126456903
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGGCCGC TCGCGCTCGC CGCCGGCATC GCACATGGCG CGACGGATTG GGTCGATACG 
CATACCAAAG CTTTCCTGAA TCACGCGCAG ATCGAGACGC TCGCCCGCGG CGCGAACGCC 
GCATCGCTCG AGGTCGCGTC GGGCGAAGCC ACGCACGTCG TGGTCAGCCT GAAGCTGCGC 
AACGCCGAGC AATTGAAAGC CGTCGCGCGC AACGTCAACG ATCCGCATAG CTCGCAGTAT 
CGGCAGTACA TCACGAGCGC GCAGTTCCTC GCGAACTATG CGCCGACCGA AGCGCAGGTG 
AAACAGGTCG TTGCCTATTT GCGCAAGAAC GGCTTCGTCG ACATCCACGT CGCGCCGAAT 
CGCATGCTCG TCTCCGCGCG CGGCACCGCC GGCACGGTCA AGCAGGCGTT CAACACGTCG 
CTCGTGCATT TCGAGTACGC GGGCCGCGCG GGCTTCGCGA ACGCGTCGAC GGCGCAAGTG 
CCGCGCGCGC TCGGCGACAT CGTCGGCTCC GTGCTCGGCC TGCAGAACGT CGCGCGCGCC 
CGGCCGCTCA CGAAGATCGG CGCGATCGCG AAACCGCTCG CGCTCGCGTC CGGCACGGCG 
ACGGGCCACT ATCCATCCGA GTTTCCGGCG CTCTACAACG CAACGGGCGT GCCCACCGCG 
GCGAACGCGA CGGTCGGCAT CATCACGATC GGCGGCGTGT CGCAAGCGCT GTCGGATCTG 
CAGCAGTTCA CGAGCGCGAA CAGCTATCCG GACGTGTCGA CGCAGACCAT CCAGACCAAC 
GGTTCCGGCG GCAACTACAG CGACGATCAG GAAGGCCAGG GCGAATGGGA TCTGGACAGC 
CAGTCGATCG TCGGCGCCGC GGGCGGCCAG CTCGGGCAAC TGATCTTCTA CATGGCCGAT 
CTCGACGCGT CGGGCAACAC CGGCCTCACG CAGGCATTCA ACCAGGCGGT GTCGGACAAC 
GCGGCGAAAG TGATCAACGT CTCGCTCGGC TGGTGCGAAA CCGATGCGAA CGCGGACGGC 
ACGCTTTCCG CCGAAGAGCA GATCTTCACG CAGGCGGTCG CGCAAGGTCA GACGTTCGCG 
GTGTCCTCAG GCGACGAAGG CGTCTACGAG TGCAACAACC GCGGCTATCC CGATGGTTCG 
AACTACACGG TATCGTGGCC GGCGTCGTCG CCGCACGTGC TCGCGATCGG CGGCACGACG 
CTCTACACGA CTTCGTCGGG CGCATTCTCG AACGAAACGG TATGGAACGA AGGGCTCGAC 
GGCAACGGCA AGCTGTGGGC GACGGGCGGC GGCGTCAGCA CGATCCTGCC GAACCCGTCA 
TGGCAGTCGG GCAGCCATCG CAAGCTGCCG GACATATCGT TCGACGCCGC GCAAAGCACG 
GGCGCGTATA TCTACAATTA CGGCCAGTTG CAGCAGATCG GCGGCACGAG CCTGTCGGCG 
CCGATTTTCA CGGGCTTCTG GGCGCGGCTC CTGTCGGCGA ACGGCACGGG TCTCGGCTTC 
CCGGCCGCGC GCTTCTACCA CTCGATTCCG ACCCACGCGT CGCTCGTGCG CTACGACGTC 
ACGTCGGGCA ACAACGGCTA TTCGGGATAC GGCTACAAGG CATCGACCGG CTGGGACTAC 
CCGACCGGCT GGGGCAGCAT CAACATCTCG AACCTGAATC AGTTGATCCA GTCGGGCGGC 
TTCAATTGA

Protein sequence

MWPLALAAGI AHGATDWVDT HTKAFLNHAQ IETLARGANA ASLEVASGEA THVVVSLKLR 
NAEQLKAVAR NVNDPHSSQY RQYITSAQFL ANYAPTEAQV KQVVAYLRKN GFVDIHVAPN 
RMLVSARGTA GTVKQAFNTS LVHFEYAGRA GFANASTAQV PRALGDIVGS VLGLQNVARA 
RPLTKIGAIA KPLALASGTA TGHYPSEFPA LYNATGVPTA ANATVGIITI GGVSQALSDL 
QQFTSANSYP DVSTQTIQTN GSGGNYSDDQ EGQGEWDLDS QSIVGAAGGQ LGQLIFYMAD 
LDASGNTGLT QAFNQAVSDN AAKVINVSLG WCETDANADG TLSAEEQIFT QAVAQGQTFA 
VSSGDEGVYE CNNRGYPDGS NYTVSWPASS PHVLAIGGTT LYTTSSGAFS NETVWNEGLD 
GNGKLWATGG GVSTILPNPS WQSGSHRKLP DISFDAAQST GAYIYNYGQL QQIGGTSLSA 
PIFTGFWARL LSANGTGLGF PAARFYHSIP THASLVRYDV TSGNNGYSGY GYKASTGWDY 
PTGWGSINIS NLNQLIQSGG FN