Gene EcHS_A2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2069
Symbol
ID	5593138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2055894
End bp	2057252
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	40%
IMG OID	640921210
Product	heavy metal sensor histidine kinase
Protein accession	YP_001458754
Protein GI	157161436
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR01386] heavy metal sensor kinase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000000000260853
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAT TGTCTATAAC CGTCCGTTTA ACCTTGCTTT TTATATTGCT GCTGTCTGTT 
GCTGGCGCTG GAATTGTATG GACTCTCTAT AATGGCCTGG CAAGTGAGTT GAAATGGCGC 
GATGATACAA CACTCATTAA CCGGACAGCG CAGATCAAGC AGTTGTTAAT TGATGGGGTA 
AATCCAGATA CGTTACCTGT GTACTTTAAC CGGATGATGG ATGTTAGTCA GGATATCTTG 
ATCATTCATG GTGATGGCAT CAATAAAATT GTTAACCGGA CGAATGTCAG TGATGACATG 
TTAAATAACA TACCTGCTAG TGAGACAATC AGCGCAGCTG GCATTTACAG AAGCATTATT 
AATGATACAG AGATAGATGC TTTACGAATT AATATTGATG AAGTTTCGCC ATCATTAACG 
GTTACTGTGG CTAAATTGGC TTCAGCCAGA CATAACATGC TTGAACAGTA TAAAATTAAT 
AGCATTATAA TTTGCATTGT CGCCATTGTA CTTTGCTCAG TATTAAGTCC GCTGTTAATC 
AGAACGGGAT TACGAGAGAT CAAAAAGTTG AGTGGTGTAA CGGAAGCGCT GAATTATAAC 
GATAGCCGGG AGCCTGTTGA GGTTAGCGCA TTACCGAGAG AACTAAAACC TCTTGGGCAG 
GCGTTGAATA AAATGCATCA AGCCTTAGTC AAAGATTTTG AACGCCTAAG TCAATTTGCT 
GACGATCTCG CTCATGAACT TAGAACGCCC ATTAATGCAT TACTGGGTCA GAATCAGGTT 
ACGCTCAGTC AAACCAGAAG TATCGCTGAA TATCAAAAAA CAATTGCCGG TAACATTGAA 
GAGCTGGAAA ATATTTCGCG GTTAACAGAG AACATACTGT TTCTTGCCCG GGCAGATAAA 
AACAATGTTT TGGTGAAACT GGACTCGCTT TCTCTCAATA AGGAAGTCGA AAATTTGTTG 
GATTATCTTG AATACCTTTC AGACGAGAAA GAGATTTGCT TTAAGGTCGA GTGCAATCAG 
CAAATCTTTG CGGATAAAAT TTTACTGCAA CGAATGTTAT CGAATCTTAT TGTTAATGCC 
ATTAGATATT CACCAGAAAA ATCGCGTATT CATATAACCA GTTTTCTTGA TACCAACGGC 
TATCTTAATA TTGATGTCGC CAGTCCTGGA ACGAAAATTC ATGAGCCTGA AAAACTCTTC 
CGTAGATTTT GGCGGGGAGA TAATTCGCGT CATTCCGTAG GTCAGGGACT TGGTCTTTCT 
TTAGTCAAAG CGATTGCCGA ATTACATGGG GGAAGTGCTA CGTATCACTA TCTCAATAAG 
CATAATGTGT TCCGGATTAT GTTACCGCAA AGAAATTAA

Protein sequence

MKRLSITVRL TLLFILLLSV AGAGIVWTLY NGLASELKWR DDTTLINRTA QIKQLLIDGV 
NPDTLPVYFN RMMDVSQDIL IIHGDGINKI VNRTNVSDDM LNNIPASETI SAAGIYRSII 
NDTEIDALRI NIDEVSPSLT VTVAKLASAR HNMLEQYKIN SIIICIVAIV LCSVLSPLLI 
RTGLREIKKL SGVTEALNYN DSREPVEVSA LPRELKPLGQ ALNKMHQALV KDFERLSQFA 
DDLAHELRTP INALLGQNQV TLSQTRSIAE YQKTIAGNIE ELENISRLTE NILFLARADK 
NNVLVKLDSL SLNKEVENLL DYLEYLSDEK EICFKVECNQ QIFADKILLQ RMLSNLIVNA 
IRYSPEKSRI HITSFLDTNG YLNIDVASPG TKIHEPEKLF RRFWRGDNSR HSVGQGLGLS 
LVKAIAELHG GSATYHYLNK HNVFRIMLPQ RN