Gene EcHS_A3983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3983
Symbol
ID	5591166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3976860
End bp	3978380
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	51%
IMG OID	640923088
Product	putative ATP-dependent protease
Protein accession	YP_001460559
Protein GI	157163241
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0606] Predicted ATPase with chaperone activity
TIGRFAM ID	[TIGR00368] Mg chelatase-related protein

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTGT CAATTGTTCA TACCCGCGCA GCCCTGGGAG TAAATGCGCC CCCAATCACT 
GTTGAGGTAC ATATCAGTAA AGGTCTACCC GGCTTAACGA TGGTGGGCTT ACCAGAAACA 
ACGGTGAAAG AAGCTCGCGA TCGCGTGCGC AGCGCCATTA TCAATAGCGG ATATGAATAT 
CCGGCGAAAA AAATCACCAT CAACCTTGCT CCAGCCGATC TACCAAAAGA AGGGGGACGA 
TATGATTTAC CTATCGCCAT TGCGTTGCTG GCGGCCTCAG AACAGCTTAC AGCCAATAAG 
TTAGATGAAT ATGAATTAGT CGGAGAACTG GCGCTTACAG GCGCTCTGCG TGGCGTTCCC 
GGCGCAATCT CCAGTGCAAC TGAAGCTATT AAGTCGGGCA GAAAAATTAT CGTCGCGAAA 
GATAACGAAG ATGAAGTGGG GCTAATTAAC GGTGAAGGAT GCCTGATAGC CGATCATCTG 
CAAGCTGTCT GTGCGTTTCT GGAAGGTAAG CACGCTCTCG AACGCCCGAA ACCAACTGAT 
GCAGTATCCC GGGCGCTACA ACATGATCTC AGTGATGTTG TCGGTCAGGA ACATGGAAAG 
CGAGGACTGG AAATTACCGC CGCTGGCGGG CACAACCTTT TACTGATTGG GCCTCCGGGA 
ACAGGTAAAA CAATGCTCGC CAGCCGTATT AATGGCCTGT TGCCAGATTT AAGCAATGAA 
GAGGCACTGG AGAGTGCTGC GATATTAAGT CTGGTAAATG CTGAATCAGT ACAAAAACAA 
TGGCGGCAGC GCCCGTTCCG CTCACCTCAT CACAGTGCAT CGTTAACTGC GATGGTAGGC 
GGTGGCGCAA TTCCAGGGCC CGGTGAAATT TCGCTGGCGC ATAACGGCGT GCTTTTTCTT 
GATGAGTTAC CTGAATTTGA AAGGCGTACA CTGGATGCCT TGCGAGAGCC GATTGAATCC 
GGGCAGATCC ATCTTTCACG CACGCGAGCA AAAATAACCT ATCCAGCCCG TTTCCAGCTT 
GTCGCGGCGA TGAATCCCAG CCCTACCGGA CATTATCAGG GAAACCATAA CCGCTGCACA 
CCAGAGCAAA CGCTGCGTTA TCTCAACCGA CTCTCTGGTC CCTTTCTCGA CCGCTTCGAT 
CTCTCACTGG AGATCCCATT ACCGCCTCCC GGTATTTTGA GTAAAACGGT AGTGCCGGGA 
GAAAGCAGCG CCACCGTTAA ACAACGCGTA ATGGCCGCCA GAGAGCGCCA ATTTAAGCGG 
CAGAATAAAC TGAACGCCTG GCTGGATAGT CCGGAAATAC GCCAATTCTG CAAACTTGAG 
AGCGAAGATG CGATGTGGCT GGAAGAAACG CTGATCCATC TGGGGTTATC GATTCGTGCC 
TGGCAGCGGT TATTGAAAGT TGCACGAACC ATTGCTGATA TTGATCAGTC TGACATTATC 
ACACGTCAAC ATTTGCAGGA GGCAGTTAGC TATCGAGCGA TTGACCGTTT GCTCATCCAT 
CTGCAGAAAC TACTGACATA A

Protein sequence

MSLSIVHTRA ALGVNAPPIT VEVHISKGLP GLTMVGLPET TVKEARDRVR SAIINSGYEY 
PAKKITINLA PADLPKEGGR YDLPIAIALL AASEQLTANK LDEYELVGEL ALTGALRGVP 
GAISSATEAI KSGRKIIVAK DNEDEVGLIN GEGCLIADHL QAVCAFLEGK HALERPKPTD 
AVSRALQHDL SDVVGQEHGK RGLEITAAGG HNLLLIGPPG TGKTMLASRI NGLLPDLSNE 
EALESAAILS LVNAESVQKQ WRQRPFRSPH HSASLTAMVG GGAIPGPGEI SLAHNGVLFL 
DELPEFERRT LDALREPIES GQIHLSRTRA KITYPARFQL VAAMNPSPTG HYQGNHNRCT 
PEQTLRYLNR LSGPFLDRFD LSLEIPLPPP GILSKTVVPG ESSATVKQRV MAARERQFKR 
QNKLNAWLDS PEIRQFCKLE SEDAMWLEET LIHLGLSIRA WQRLLKVART IADIDQSDII 
TRQHLQEAVS YRAIDRLLIH LQKLLT