Gene BMAA1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA1559
Symbol
ID	3087692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	+
Start bp	1683758
End bp	1685455
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	69%
IMG OID	637565443
Product	thermolysin metallopeptidase
Protein accession	YP_106144
Protein GI	53716301
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.837695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAC TGTCCTGCCT GCTGTCGGTC ACCGCGATTT CCCTTGCATG CCTCAGCGCG 
TTCGCGCAAG CCGACGATCC GCCGGCCGCG GCCGACCGCG CGCTGCAACT GATCCGACAG 
AACCCGTCCG CCTTCCACCT CGCCGCCGGC AGCGCCGCGC GCACGCTGAA GTTCGCCGGC 
GCGCAAGCGA AGGCGCCGGC GGACGGCGAC CAGTTCCAGG TGCGCGACGT GATCGTCGAC 
GCCGACGGCA CCGAGCACGT GCGCTTCGAT CGCTTCTACG CGGGGCTGCC CGTGATCGGC 
GGCGACGTCG TCGTCCATTC GAACCAGGGG CAACTGAAGC AGGCGAGCCT CACGCAGCCC 
GCGCCGATCG ATCTCGCGGG CAAGATCGGC AAGGTGGGCG AGCGCTTCGT CGTGCGCAAC 
GCGCCCGACG TGGGCGCGGA CGCGGCAAGA CGCGTCGCGT CGAAGCGCTT CGGCGCGGAC 
GTGCGCCGCG TCGACGGCGC GGATCTCGTC GTGTTCGCGC GCGACGCCGC GCCGACGCTC 
GCCTACGCGG TGCGCGTGTA CGGCAAGGCG ACCGACGCGC ACGGCGAGGC CGTGATCTAC 
TACGTCGACG CGCGCACGGG CAACGTGCTG GACGCGCAGG ACCTGATCAA GACCGCCTCC 
GTGACGGGCA CCGGCCGCTC GCTGTACTAC GGCAACCTGT CGCTCACGAC CGATCAGACC 
GGCACGAACG CGTACCGGAT GCTCGATCCG ACGCGCGGCA GCGGCTCGGT CTACGACGGG 
CGCGGCCTGA GCTCGGACGA AGTCGAGCAG GCGAGCGACC TGCCGATCTT CACGAGCAGC 
ACGAACGTGT GGGGCAACAA CACGACGAGC GACCGGCAGA CCGTCGCCGC CGACATCGAC 
TACGGCCTCG CGCTGACGTG GGATTACTAC AAGACCACGC ACAACCGCAA CGGCATCTTC 
AACGACGGCC GCGGCGTGCG CAGCTACGCG CACGTGGTGT TCGACACCGG CAGCGGCACG 
ACGGGCGCGA ACGCCGCGTG GCTGTCGTCG CGCGTGATGG TGTACGGCGA CGGCGAGCCG 
GGCACGCGGC TGCCGAAGCC CGTCGTGTCG GTCGACGTGG CCGGGCACGA GATGAGCCAC 
GGCGTGACCG AGGCCACCTC GAACCTGTAT TATTCGGGCG ACGCGGGCGG CCTGAACGAA 
TCGACGTCGG ACATCTTCGG CACGCTCGTC AAGTACTACG CGAACAATCC GAACGACCCG 
GGCAACTACG TGATCGGCGC GCGGATCACG AGCGGCGGCC TGCGCAAGAT GTACAAGCAG 
GATCTCGACG GCCGCTCATA CAGTTGCTAC CCGTCCGGCG GCTTCTCGTG GGCGAATCCG 
CGCCACGATC CGCACTACAC GTCGGGCGTC GGCAACCGGT TCTTCTATCT GCTCGCGGAA 
GGCCCGGTCG CGCCGTCGAC CGATACCGGA CTGTCGAGGA GCCAGCTCGT CTGCAACGGC 
GACACCGGCT TCAGCGGCCT CGGCCGCGAC AAGGCGGGCA AGATCTGGTA TCGCACGCTC 
ACCGTGTACC TGACCACCAA CTCCAGCTAC CCGGGCGCGC GTCGCGCGTC GATCCAGGCG 
GCGAACGATC TGTACGGCGT GAATTCGCTC GAGAGCGCAA CGGTCGCGCG CGCGTGGAGC 
GCCGCCGGCG TGAACTGA

Protein sequence

MKKLSCLLSV TAISLACLSA FAQADDPPAA ADRALQLIRQ NPSAFHLAAG SAARTLKFAG 
AQAKAPADGD QFQVRDVIVD ADGTEHVRFD RFYAGLPVIG GDVVVHSNQG QLKQASLTQP 
APIDLAGKIG KVGERFVVRN APDVGADAAR RVASKRFGAD VRRVDGADLV VFARDAAPTL 
AYAVRVYGKA TDAHGEAVIY YVDARTGNVL DAQDLIKTAS VTGTGRSLYY GNLSLTTDQT 
GTNAYRMLDP TRGSGSVYDG RGLSSDEVEQ ASDLPIFTSS TNVWGNNTTS DRQTVAADID 
YGLALTWDYY KTTHNRNGIF NDGRGVRSYA HVVFDTGSGT TGANAAWLSS RVMVYGDGEP 
GTRLPKPVVS VDVAGHEMSH GVTEATSNLY YSGDAGGLNE STSDIFGTLV KYYANNPNDP 
GNYVIGARIT SGGLRKMYKQ DLDGRSYSCY PSGGFSWANP RHDPHYTSGV GNRFFYLLAE 
GPVAPSTDTG LSRSQLVCNG DTGFSGLGRD KAGKIWYRTL TVYLTTNSSY PGARRASIQA 
ANDLYGVNSL ESATVARAWS AAGVN