Gene EcolC_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4236
Symbol
ID	6067869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4680017
End bp	4681537
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	51%
IMG OID	641603667
Product	putative ATP-dependent protease
Protein accession	YP_001727159
Protein GI	170022205
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0606] Predicted ATPase with chaperone activity
TIGRFAM ID	[TIGR00368] Mg chelatase-related protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.250822
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.127263
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTGT CAATTGTTCA TACCCGCGCA GCCCTGGGAG TAAATGCGCC CCCAATCACT 
GTTGAGGTAC ATATCAGTAA AGGTCTACCC GGCTTAACGA TGGTGGGCTT ACCAGAAACA 
ACGGTGAAAG AAGCTCGCGA TCGCGTGCGC AGCGCCATTA TCAATAGCGG ATATGAATAT 
CCGGCGAAAA AAATCACCAT CAACCTTGCT CCAGCCGATC TACCAAAAGA AGGGGGACGA 
TATGATTTAC CTATCGCCAT TGCGTTGCTG GCGGCCTCAG AACAGCTTAC AGCCAATAAG 
TTAGATGAAT ATGAATTAGT CGGAGAACTG GCGCTTACAG GCGCTCTGCG TGGCGTTCCC 
GGCGCAATCT CCAGTGCAAC TGAAGCTATT AAGTCGGGCA GAAAAATTAT CGTCGCGAAA 
GATAACGAAG ATGAAGTGGG GCTAATTAAC GGTGAAGGAT GCCTGATAGC CGATCATCTG 
CAAGCTGTCT GTGCGTTTCT GGAAGGTAAG CACGCTCTCG AACGCCCGAA ACCAACTGAT 
GCAGTATCCC GGGCGCTACA ACATGATCTC AGTGATGTTG TCGGTCAGGA ACATGGAAAG 
CGAGGACTGG AAATTACCGC CGCTGGCGGG CACAACCTTT TACTGATTGG GCCTCCGGGA 
ACAGGTAAAA CAATGCTCGC CAGCCGTATT AATGGCCTGT TGCCAGATTT AAGCAATGAA 
GAGGCACTGG AGAGTGCTGC GATATTAAGT CTGGTAAATG CTGAATCAGT ACAAAAACAA 
TGGCGGCAGC GCCCGTTCCG CTCACCTCAT CACAGTGCAT CGTTAACTGC GATGGTAGGC 
GGTGGCGCAA TTCCAGGGCC CGGTGAAATT TCGCTGGCGC ATAACGGCGT GCTTTTTCTT 
GATGAGTTAC CTGAATTTGA AAGGCGTACA CTGGATGCCT TGCGAGAGCC GATTGAATCC 
GGGCAGATCC ATCTTTCACG CACGCGAGCA AAAATAACCT ATCCAGCCCG TTTCCAGCTT 
GTCGCGGCGA TGAATCCCAG CCCTACCGGA CATTATCAGG GAAACCATAA CCGCTGCACA 
CCAGAGCAAA CGCTGCGTTA TCTCAACCGA CTCTCTGGTC CCTTTCTCGA CCGCTTCGAT 
CTCTCACTGG AGATCCCATT ACCGCCTCCC GGTATTTTGA GTAAAACGGT AGTGCCGGGA 
GAAAGCAGCG CCACCGTTAA ACAACGCGTA ATGGCCGCCA GAGAGCGCCA ATTTAAGCGG 
CAGAATAAAC TGAACGCCTG GCTGGATAGT CCGGAAATAC GCCAATTCTG CAAACTTGAG 
AGCGAAGATG CGATGTGGCT GGAAGAAACG CTGATCCATC TGGGGTTATC GATTCGTGCC 
TGGCAGCGGT TATTGAAAGT TGCACGAACC ATTGCTGATA TTGATCAGTC TGACATTATC 
ACACGTCAAC ATTTGCAGGA GGCAGTTAGC TATCGAGCGA TTGACCGTTT GCTCATCCAT 
CTGCAGAAAC TACTGACATA A

Protein sequence

MSLSIVHTRA ALGVNAPPIT VEVHISKGLP GLTMVGLPET TVKEARDRVR SAIINSGYEY 
PAKKITINLA PADLPKEGGR YDLPIAIALL AASEQLTANK LDEYELVGEL ALTGALRGVP 
GAISSATEAI KSGRKIIVAK DNEDEVGLIN GEGCLIADHL QAVCAFLEGK HALERPKPTD 
AVSRALQHDL SDVVGQEHGK RGLEITAAGG HNLLLIGPPG TGKTMLASRI NGLLPDLSNE 
EALESAAILS LVNAESVQKQ WRQRPFRSPH HSASLTAMVG GGAIPGPGEI SLAHNGVLFL 
DELPEFERRT LDALREPIES GQIHLSRTRA KITYPARFQL VAAMNPSPTG HYQGNHNRCT 
PEQTLRYLNR LSGPFLDRFD LSLEIPLPPP GILSKTVVPG ESSATVKQRV MAARERQFKR 
QNKLNAWLDS PEIRQFCKLE SEDAMWLEET LIHLGLSIRA WQRLLKVART IADIDQSDII 
TRQHLQEAVS YRAIDRLLIH LQKLLT