Gene Mvan_4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4036
Symbol	clpX
ID	4648437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4318802
End bp	4320082
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	65%
IMG OID	639807498
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_954819
Protein GI	120404990
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.330745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.230586
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGCA TTGGAGATGG CGGCGACCTG CTGAAGTGCT CGTTCTGCGG CAAGAGCCAA 
AAGCAGGTGA AGAAGCTCAT CGCGGGACCC GGCGTCTACA TCTGCGACGA GTGCATCGAC 
CTGTGCAACG AGATCATCGA GGAAGAACTC GCCGACGCCG ACGACGTCAA GCTCGATGAG 
CTGCCCAAAC CTGCGGAGAT CCGTGAGTTC CTCGAGGGCT ACGTCATCGG GCAGGACACC 
GCCAAGCGCA CGCTGGCCGT GGCCGTCTAC AACCACTACA AGCGCATCCA GGCGGGCGAG 
AAGGCCCGCG ACTCGCGCTC GGAGCCCGTC GAGCTGGCCA AGTCCAACAT CCTGATGCTC 
GGCCCGACGG GCTGTGGCAA GACCTACCTC GCGCAGACGC TGGCCAAGAT GCTCAACGTC 
CCGTTCGCGA TCGCGGATGC GACGGCGCTG ACCGAAGCCG GCTATGTCGG TGAGGACGTC 
GAGAACATTC TGCTCAAACT GATCCAGGCC GCCGACTACG ACGTCAAGCG CGCCGAGACG 
GGCATCATCT ACATCGACGA GGTCGACAAG ATCGCCCGCA AGAGCGAGAA CCCGTCGATC 
ACCCGGGACG TCTCCGGTGA GGGCGTACAG CAGGCGCTGC TGAAGATCCT GGAAGGCACG 
CAGGCGTCGG TGCCCCCGCA GGGCGGACGC AAGCACCCGC ACCAGGAGTT CATCCAGATC 
GACACCACCA ACGTGCTGTT CATCGTGGCA GGCGCGTTCG CCGGCTTGGA GCGGATCGTG 
TCCGACCGCG TCGGCAAGCG TGGCCTGGGC TTCGGCGCCG AGGTGAAGTC CAAGGCCGAG 
ATCGACACCC AGGACCACTT CGCCGAGGTG ATGCCCGAGG ATCTGATCAA GTTCGGTCTG 
ATCCCCGAGT TCATCGGCCG GCTCCCGGTC GTCGCGTCGG TGACGAACCT GGACAAGGAA 
TCGCTCGTGC AGATCCTGTC CCAGCCGAAG AACGCGTTGG TCAAGCAGTA CACCCGGCTG 
TTCGAGATGG ACGGTGTGGA GCTGGAGTTC GCCGAAGACG CGCTGGAGGC GATCGCCGAT 
CAGGCCATCC ACCGTGGCAC CGGCGCCCGC GGTCTGCGCG CCATCATGGA GGAAGTCCTG 
CTGCCGGTGA TGTACGACAT CCCGAGCCGC GACGACGTCG CCAAGGTGGT CGTCACCAAG 
GAGACCGTGC TGGACAACGT GCTGCCGACC ATCGTGCCGC GCAAGCCGTC CCGCACCGAG 
CGTCGCGACA AGAGCGCCTA G

Protein sequence

MARIGDGGDL LKCSFCGKSQ KQVKKLIAGP GVYICDECID LCNEIIEEEL ADADDVKLDE 
LPKPAEIREF LEGYVIGQDT AKRTLAVAVY NHYKRIQAGE KARDSRSEPV ELAKSNILML 
GPTGCGKTYL AQTLAKMLNV PFAIADATAL TEAGYVGEDV ENILLKLIQA ADYDVKRAET 
GIIYIDEVDK IARKSENPSI TRDVSGEGVQ QALLKILEGT QASVPPQGGR KHPHQEFIQI 
DTTNVLFIVA GAFAGLERIV SDRVGKRGLG FGAEVKSKAE IDTQDHFAEV MPEDLIKFGL 
IPEFIGRLPV VASVTNLDKE SLVQILSQPK NALVKQYTRL FEMDGVELEF AEDALEAIAD 
QAIHRGTGAR GLRAIMEEVL LPVMYDIPSR DDVAKVVVTK ETVLDNVLPT IVPRKPSRTE 
RRDKSA