Gene BURPS1106A_A0758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0758
Symbol
ID	4905802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	750804
End bp	752507
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	68%
IMG OID	640143864
Product	metallopeptidase domain-containing protein
Protein accession	YP_001074794
Protein GI	126457443
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGACAT CCCGTAAAGC ACTGCCGCTC GCGCTGGGTC TTGCCATCGG CCTCGGCGCC 
GCGCTGCCCG CGTGGGCCGA TTCGAAGGCA CCGAGCCCGC AGGAGGAAAG CCGGCGCGCG 
AGCCTCACGC GCGGCGTCGT GGCGCCTGCG GAACAGGCCG GCAAGACCGG ACAGTTCCGC 
CCCGGGGCCG TTGCCGTGAC GCTGGCGAGC CCGGCGTTTC ATGCGAAGAA GGCCGATGCG 
GCGGCGATGG CGCGCGAGTA CGTCACCGCG CGCGCAGCGC AGCTCGGCCT CGACAAGGCC 
GCGCTCGCGA ATCTCGTCGT CGCGTCCGAA CGCGCCGATA CCGCGTTCAC CGTCGTGCGC 
TTCCAGCAGC GCGCCGCGGG GCTGCCCGTC TATGACAGCG ACATCGCGGT CACGGTCGCG 
CCGGACGGCC GCGTGCTGTA CGTCGCGAGC AAGGCGGTGA GCGGCGTCGC GGCCGTGTCG 
AGCAAGACGC AGGCGGTCGA CGAGCAGCAG GCGCTCGACC GCGCGCGCGC CTACCTCGGC 
GTCGGCGGCT TCGTGAACGT GCAGTCGCAG CTCGTCGCAT TCGTCGACGG CGCGGGCACA 
CATACCGCGT GGAAGGTGAG CGGCAGGCCG CAGGACAGCC TGCACGGCGA CTGGGAGCTG 
ATCATCGACG CGGGCAGCGG CGAAGTGCTG CGCGCGCAAG ACAAGGCATC CTACGCAACG 
GACGGCAGCG GGCTCGTGTT CCGGCCGGAT CCGTTGTCCC CGACGAAAAG CAGCTACGGC 
AGCCCCGGCT TCAAGGACAA CAACGATGCG GATTCGCCGC AACTGAGCGC CGCGCGCGTG 
CGCGTGACGC TCAAGGATCT GACGCAGACG AGCGGCGGCT ACAAGCTGAG CGGCCCGTAT 
GCATCGTGCA TCGATTTCGA TGCGCCGCTC GACAAGGCGT GCCCGGTTCA GGCGTCGACG 
ACCTTCGATT TCACACGCTC GAACCTCTAT TTCGAGGCGG TGAACGCGTA TTACCACATC 
GACACGTTCC TGCGCTACGT GAACCTGACG CTCGGCATCA AGGCGTTGCC GTACCAGTAC 
GCGGGCGGCG TCCAGTACGA TCCGCACGGC CAATCCGGCG ACGATAACTC GTCGTACTCG 
CCGAGCTCCG GCAGGTTGTC GTTCGGGCAA GGCGGCGTCG ACGACGCGGA AGACGCGGAT 
GTCGTGATTC ACGAGCTCGG CCACGGCATC CATGACTGGA TCACCAACGG CGGACTGTCG 
CAGGTCGAGG GGCTGTCCGA AGGCACGGGC GACTACCTCG CGGCCGCATA CAGCCGCGAC 
TTCAACCAAT GGAGCCCGTC CGACGCGCAG TATCACTGGG TCTTCAACTG GGACGGCCAC 
AACGAATTCT GGGCCGGCCG CGTCACCAAT TACAACGTCG GCCGCACGTA CGCGCAGATC 
CGCAATGCCG CGATCCACAC CGCCGGCCAG TACTGGGCGT CGTGCAACAT GGTCGCGCGC 
GATGCGATCG GCGGCGCGGC GATGGACAAG GCTTTCCTGA AAGGATTGTC GATGACGAAC 
GGCTCGACGA ACCAGAAGGC CGCGGCGCAG GCGGTGCTGA CCGCGGCGGC GGCGCTCGGC 
TACAGCAGCG CGCAGCTCAA TGCGATCGGC GATGCGTACA ACAAGAGCTG CACATACGGC 
GTGACCGTGC CGCAGAAGCT GTAA

Protein sequence

MQTSRKALPL ALGLAIGLGA ALPAWADSKA PSPQEESRRA SLTRGVVAPA EQAGKTGQFR 
PGAVAVTLAS PAFHAKKADA AAMAREYVTA RAAQLGLDKA ALANLVVASE RADTAFTVVR 
FQQRAAGLPV YDSDIAVTVA PDGRVLYVAS KAVSGVAAVS SKTQAVDEQQ ALDRARAYLG 
VGGFVNVQSQ LVAFVDGAGT HTAWKVSGRP QDSLHGDWEL IIDAGSGEVL RAQDKASYAT 
DGSGLVFRPD PLSPTKSSYG SPGFKDNNDA DSPQLSAARV RVTLKDLTQT SGGYKLSGPY 
ASCIDFDAPL DKACPVQAST TFDFTRSNLY FEAVNAYYHI DTFLRYVNLT LGIKALPYQY 
AGGVQYDPHG QSGDDNSSYS PSSGRLSFGQ GGVDDAEDAD VVIHELGHGI HDWITNGGLS 
QVEGLSEGTG DYLAAAYSRD FNQWSPSDAQ YHWVFNWDGH NEFWAGRVTN YNVGRTYAQI 
RNAAIHTAGQ YWASCNMVAR DAIGGAAMDK AFLKGLSMTN GSTNQKAAAQ AVLTAAAALG 
YSSAQLNAIG DAYNKSCTYG VTVPQKL