Gene EcE24377A_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0474
Symbol	clpX
ID	5587882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	492574
End bp	493848
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	52%
IMG OID	640924198
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001461625
Protein GI	157157655
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000022349
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGATA AACGCAAAGA TGGCTCAGGC AAATTGCTGT ATTGCTCTTT TTGCGGCAAA 
AGCCAGCATG AAGTGCGCAA GCTGATTGCC GGTCCATCCG TGTATATCTG CGACGAATGT 
GTTGATTTAT GTAACGACAT CATTCGCGAA GAGATTAAAG AAGTTGCACC GCATCGTGAA 
CGCAGTGCGC TACCGACGCC GCATGAAATT CGCAACCACC TGGACGATTA CGTTATCGGC 
CAGGAACAGG CGAAAAAAGT GCTGGCGGTC GCGGTATACA ACCATTACAA ACGTCTGCGC 
AACGGCGATA CCAGCAATGG TGTCGAGTTG GGCAAAAGTA ACATTCTGCT GATCGGTCCG 
ACCGGTTCCG GTAAAACGCT GCTGGCTGAA ACGCTGGCGC GCCTGCTGGA CGTCCCGTTC 
ACCATGGCCG ACGCAACCAC GCTGACCGAA GCCGGTTATG TGGGCGAAGA CGTTGAAAAC 
ATCATTCAGA AACTGTTGCA GAAATGCGAC TACGATGTCC AGAAAGCACA GCGTGGTATT 
GTCTACATCG ATGAAATCGA CAAGATTTCT CGTAAGTCGG ACAACCCGTC TATTACCCGT 
GACGTTTCCG GTGAAGGCGT ACAGCAGGCA CTGTTGAAAC TGATCGAAGG TACTGTTGCT 
GCCGTTCCAC CGCAGGGCGG GCGTAAGCAT CCGCAGCAGG AATTTTTGCA GGTTGATACC 
TCCAAGATCC TGTTTATTTG TGGCGGTGCG TTTGCCGGTC TGGATAAAGT GATTTCCCAC 
CGTGTAGAAA CCGGCTCCGG CATTGGTTTT GGCGCGACGG TAAAAGCGAA GTCCGACAAA 
GCAAGCGAAG GCGAGCTGCT GGCGCAGGTT GAACCGGAAG ATCTGATCAA GTTTGGTCTT 
ATCCCTGAGT TCATTGGTCG TCTGCCGGTT GTCGCAACGT TGAATGAACT GAGCGAAGAA 
GCTCTGATTC AGATCCTCAA AGAGCCGAAA AACGCCCTGA CCAAGCAGTA TCAGGCGCTG 
TTTAATCTGG AAGGCGTGGA TCTGGAATTC CGTGACGAGG CGCTGGATGC TATCGCTAAG 
AAAGCGATGG CGCGTAAAAC CGGTGCCCGT GGCCTGCGTT CCATCGTAGA AGCCGCACTG 
CTCGATACCA TGTACGATCT GCCGTCCATG GAAGACGTCG AAAAAGTGGT TATCGACGAG 
TCGGTAATTG ATGGTCAAAG CAAACCGTTG CTGATTTATG GTAAGCCGGA AGCGCAACAG 
GCATCTGGTG AATAA

Protein sequence

MTDKRKDGSG KLLYCSFCGK SQHEVRKLIA GPSVYICDEC VDLCNDIIRE EIKEVAPHRE 
RSALPTPHEI RNHLDDYVIG QEQAKKVLAV AVYNHYKRLR NGDTSNGVEL GKSNILLIGP 
TGSGKTLLAE TLARLLDVPF TMADATTLTE AGYVGEDVEN IIQKLLQKCD YDVQKAQRGI 
VYIDEIDKIS RKSDNPSITR DVSGEGVQQA LLKLIEGTVA AVPPQGGRKH PQQEFLQVDT 
SKILFICGGA FAGLDKVISH RVETGSGIGF GATVKAKSDK ASEGELLAQV EPEDLIKFGL 
IPEFIGRLPV VATLNELSEE ALIQILKEPK NALTKQYQAL FNLEGVDLEF RDEALDAIAK 
KAMARKTGAR GLRSIVEAAL LDTMYDLPSM EDVEKVVIDE SVIDGQSKPL LIYGKPEAQQ 
ASGE