Gene EcHS_A3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3601
Symbol	envZ
ID	5591710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3578875
End bp	3580227
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	57%
IMG OID	640922718
Product	osmolarity sensor protein
Protein accession	YP_001460199
Protein GI	157162881
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCGAT TGCGCTTCTC GCCACGAAGT TCATTTGCCC GTACGTTATT GCTCATCGTC 
ACCTTGCTGT TCGCCAGCCT GGTGACGACT TATCTGGTGG TGCTGAACTT CGCGATTTTG 
CCGAGCCTCC AGCAGTTTAA TAAAGTCCTC GCGTACGAAG TGCGTATGTT GATGACCGAC 
AAACTGCAAC TGGAGGACGG CACGCAGTTG GTTGTGCCTC CCGCTTTCCG TCGGGAGATC 
TACCGTGAGC TGGGGATCTC TCTCTACTCC AACGAGGCTG CCGAAGAGGC AGGTCTGCGT 
TGGGCGCAAC ACTATGAATT CTTAAGCCAT CAGATGGCGC AGCAACTGGG CGGCCCGACG 
GAAGTGCGCG TTGAGGTCAA CAAAAGTTCG CCTGTCGTCT GGCTGAAAAC CTGGCTGTCG 
CCCAATATCT GGGTACGCGT GCCGCTGACC GAAATTCATC AGGGCGATTT CTCTCCGCTG 
TTCCGCTATA CGCTGGCGAT TATGCTATTG GCGATAGGCG GGGCGTGGCT GTTTATTCGT 
ATCCAGAACC GACCGTTGGT CGATCTCGAA CACGCAGCCT TGCAGGTTGG TAAAGGGATT 
ATTCCGCCGC CGCTGCGTGA GTATGGCGCG TCCGAGGTGC GTTCCGTTAC CCGTGCCTTT 
AACCATATGG CGGCTGGTGT TAAGCAACTG GCGGATGACC GCACGCTGCT GATGGCGGGG 
GTAAGTCACG ACTTGCGCAC GCCGCTGACG CGTATTCGCC TGGCGACTGA GATGATGAGC 
GAGCAGGATG GCTATCTGGC AGAATCGATC AATAAAGATA TCGAAGAGTG CAACGCCATC 
ATTGAGCAGT TTATCGACTA CCTGCGCACC GGGCAGGAGA TGCCGATGGA AATGGCGGAT 
CTTAATGCAG TACTCGGTGA GGTGATTGCT GCCGAAAGTG GCTATGAGCG GGAAATTGAA 
ACCGCGCTTT ACCCCGGCAG CATTGAAGTG AAAATGCACC CGCTGTCGAT CAAACGCGCG 
GTGGCGAATA TGGTGGTCAA CGCCGCCCGT TATGGCAATG GCTGGATCAA AGTCAGCAGC 
GGAACGGAGC CGAATCGCGC CTGGTTCCAG GTGGAAGATG ACGGTCCGGG AATTGCGCCG 
GAACAACGTA AGCACCTGTT CCAGCCGTTT GTCCGCGGCG ACAGTGCGCG CACCATTAGC 
GGCACGGGAT TAGGGCTGGC AATTGTGCAG CGTATCGTGG ATAACCATAA CGGGATGCTG 
GAGCTTGGCA CCAGCGAGCG GGGCGGGCTT TCCATTCGCG CCTGGCTGCC AGTGCCGGTA 
ACGCGGGCGC AGGGCACGAC AAAAGAAGGG TAA

Protein sequence

MRRLRFSPRS SFARTLLLIV TLLFASLVTT YLVVLNFAIL PSLQQFNKVL AYEVRMLMTD 
KLQLEDGTQL VVPPAFRREI YRELGISLYS NEAAEEAGLR WAQHYEFLSH QMAQQLGGPT 
EVRVEVNKSS PVVWLKTWLS PNIWVRVPLT EIHQGDFSPL FRYTLAIMLL AIGGAWLFIR 
IQNRPLVDLE HAALQVGKGI IPPPLREYGA SEVRSVTRAF NHMAAGVKQL ADDRTLLMAG 
VSHDLRTPLT RIRLATEMMS EQDGYLAESI NKDIEECNAI IEQFIDYLRT GQEMPMEMAD 
LNAVLGEVIA AESGYEREIE TALYPGSIEV KMHPLSIKRA VANMVVNAAR YGNGWIKVSS 
GTEPNRAWFQ VEDDGPGIAP EQRKHLFQPF VRGDSARTIS GTGLGLAIVQ RIVDNHNGML 
ELGTSERGGL SIRAWLPVPV TRAQGTTKEG