Gene BMA10229_A3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A3349
Symbol	clpX
ID	4791401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	3400747
End bp	3402018
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	61%
IMG OID
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001029283
Protein GI	124383380
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00739015
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGACA AGAAAGGTTC GAACAGCGAG AAGCTGTTGT ATTGCTCGTT TTGCGGCAAA 
AGCCAGCATG AGGTGAAGAA GCTCATCGCG GGGCCGTCGG TATTCATCTG CGATGAATGT 
ATCGACTTGT GCAACGAGAT CATCCGCGAC GAAGCGGCCG CGGCGGGCGT CGAAGCCAGC 
CTGTCCAAAT CCGACCTGCC GAGCCCGCAG GAGATTCGCG ACATCCTCGA TCAGTACGTG 
ATCGGCCAGG AGCGCGCGAA GAAGATCCTC GCCGTCGCCG TCTACAATCA CTACAAGCGC 
CTGAAGCATC TCGACAAGAA GGACGATGTC GAGTTGTCGA AGAGCAACAT CCTGTTGATC 
GGCCCGACGG GCTCCGGCAA GACGCTGCTC GCGCAGACTC TCGCGCGCCT GCTGAACGTG 
CCGTTCGTGA TCGCCGACGC GACCACGCTG ACGGAGGCCG GTTATGTCGG CGAGGACGTC 
GAGAACATCA TCCAGAAGCT GCTGCAGAAC TGCAACTACG AGGTCGAGAA GGCGCAGCGC 
GGGATCGTCT ACATCGACGA AATCGACAAG ATCAGCTGCA AGTCGGACAA CCCGTCGATC 
ACCCGCGACG TGTCGGGCGA GGGCGTCCAG CAGGCGCTGC TCAAGCTCGT CGAGGGCACG 
ATGGCGTCGG TGCCGCCGCA GGGCGGCCGC AAGCACCCGA ACCAGGATTT CATCCAGGTC 
GACACCACCA ACATCCTGTT CATTTGCGGC GGCGCGTTCG ACGGCCTCGA GAAGGTGATC 
ACCGACCGCA CCGAAAAGAC CGGCATCGGT TTCGGCGCGA CGGTCAAGAG CAAGCAGGAG 
CGGGACGCGG GCGAAGTGCT GCGCGAGGTC GAGCCGGAAG ACCTGATCAA ATTCGGGTTG 
ATCCCCGAGC TGATCGGTCG TCTGCCGGTG GTCGCGACGC TCGGCAAGCT CGATGAAGCC 
GCGCTGATGA AGATTCTCGT CGAGCCGAAG AACGCGCTCG TCAAGCAGTA TCAGAAGCTG 
TTCGCGATGG AGCGGGTCGA ACTCGAGATT CGTCCGGACG CGCTGCAAGC CGTCGCCCGC 
AAGGCGATCC GCCGCAAGAC GGGCGCGCGC GGGCTGCGTT CGATCATCGA GCAGGCGCTC 
CTCGACGTGA TGTACGAACT GCCGACGCTC AAGGGCGTCA GCAAGGTGAT CATCGACGAC 
AATGTCATCG AAGGAGACGG CAAGCCGTTA CTGATCTATG AGGACACGCC GAAAGTGGCG 
GGTTCGAATT GA

Protein sequence

MADKKGSNSE KLLYCSFCGK SQHEVKKLIA GPSVFICDEC IDLCNEIIRD EAAAAGVEAS 
LSKSDLPSPQ EIRDILDQYV IGQERAKKIL AVAVYNHYKR LKHLDKKDDV ELSKSNILLI 
GPTGSGKTLL AQTLARLLNV PFVIADATTL TEAGYVGEDV ENIIQKLLQN CNYEVEKAQR 
GIVYIDEIDK ISCKSDNPSI TRDVSGEGVQ QALLKLVEGT MASVPPQGGR KHPNQDFIQV 
DTTNILFICG GAFDGLEKVI TDRTEKTGIG FGATVKSKQE RDAGEVLREV EPEDLIKFGL 
IPELIGRLPV VATLGKLDEA ALMKILVEPK NALVKQYQKL FAMERVELEI RPDALQAVAR 
KAIRRKTGAR GLRSIIEQAL LDVMYELPTL KGVSKVIIDD NVIEGDGKPL LIYEDTPKVA 
GSN