Gene ECH74115_4710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4710
Symbol	envZ
ID	6970484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4349790
End bp	4351142
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	57%
IMG OID	643388411
Product	osmolarity sensor protein
Protein accession	YP_002272839
Protein GI	209397426
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.570266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCGAT TGCGCTTCTC GCCACGAAGT TCATTTGCCC GTACGTTATT GCTCATCGTC 
ACCTTGCTGT TCGCCAGCCT GGTGACGACT TATCTGGTGG TGCTGAACTT CGCGATTTTG 
CCGAGCCTCC AGCAGTTTAA TAAAGTCCTC GCGTACGAAG TGCGTATGTT GATGACCGAC 
AAACTGCAAC TGGAGGACGG CACGCAGTTG GTTGTGCCTC CCGCTTTCCG TCGGGAGATC 
TACCGTGAGC TGGGGATCTC TCTCTACTCC AACGAGGCTG CCGAAGAGGC AGGTCTGCGT 
TGGGCGCAAC ACTATGAATT CTTAAGCCAT CAGATGGCAC AGCAACTGGG CGGCCCGACG 
GAAGTGCGCG TTGAGGTCAA CAAAAGTTCG CCTGTCGTCT GGCTGAAAAC CTGGCTGTCG 
CCCAATATCT GGGTACGCGT GCCGCTGACC GAAATTCATC AGGGCGATTT CTCTCCGCTG 
TTCCGCTATA CGTTGGCGAT TATGCTATTG GCGATAGGCG GGGCGTGGCT GTTTATTCGT 
ATCCAGAATC GACCGTTGGT CGATCTCGAA CACGCAGCCT TGCAGGTTGG TAAAGGGATT 
ATTCCGCCGC CGCTGCGTGA GTATGGCGCG TCCGAGGTGC GTTCCGTTAC CCGCGCCTTT 
AACCATATGG CGGCTGGTGT TAAGCAACTG GCGGATGACC GCACGCTGCT GATGGCGGGG 
GTAAGTCACG ACTTGCGTAC ACCGCTGACG CGTATTCGCC TGGCGACCGA GATGATGAGC 
GAGCAGGATG GCTACCTGGC AGAATCGATC AATAAAGATA TCGAGGAGTG CAATGCCATC 
ATTGAGCAGT TTATCGACTA CCTGCGCACC GGACAGGAGA TGCCGATGGA AATGGCGGAT 
CTCAACGCAG TACTCGGTGA GGTTATTGCT GCCGAAAGTG GCTATGAGCG GGAAATTGAA 
ACCGCGCTTT ACCCCGGCAG CATTGAAGTG AAAATGCACC CGCTGTCGAT CAAACGCGCG 
GTGGCGAATA TGGTGGTCAA CGCCGCCCGT TACGGCAATG GCTGGATCAA AGTCAGCAGC 
GGGACGGAGC CGAATCGCGC CTGGTTCCAG GTGGAAGATG ACGGTCCGGG AATTGCGCCG 
GAACAACGTA AGCACCTTTT CCAGCCGTTT GTTCGCGGCG ACAGTGCACG CACCATTAGC 
GGCACGGGAT TAGGGCTGGC GATTGTGCAG CGTATCGTGG ATAACCATAA CGGGATGCTG 
GAGCTTGGCA CCAGCGAGCG GGGCGGGCTT TCCATTCGCG CCTGGCTGCC TGTGCCGGTA 
ACGCGGGCGC AGAGCACGAC AAAAGAAGGG TAA

Protein sequence

MRRLRFSPRS SFARTLLLIV TLLFASLVTT YLVVLNFAIL PSLQQFNKVL AYEVRMLMTD 
KLQLEDGTQL VVPPAFRREI YRELGISLYS NEAAEEAGLR WAQHYEFLSH QMAQQLGGPT 
EVRVEVNKSS PVVWLKTWLS PNIWVRVPLT EIHQGDFSPL FRYTLAIMLL AIGGAWLFIR 
IQNRPLVDLE HAALQVGKGI IPPPLREYGA SEVRSVTRAF NHMAAGVKQL ADDRTLLMAG 
VSHDLRTPLT RIRLATEMMS EQDGYLAESI NKDIEECNAI IEQFIDYLRT GQEMPMEMAD 
LNAVLGEVIA AESGYEREIE TALYPGSIEV KMHPLSIKRA VANMVVNAAR YGNGWIKVSS 
GTEPNRAWFQ VEDDGPGIAP EQRKHLFQPF VRGDSARTIS GTGLGLAIVQ RIVDNHNGML 
ELGTSERGGL SIRAWLPVPV TRAQSTTKEG