Gene ECH74115_3790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3790
Symbol
ID	6967720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3514154
End bp	3515581
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID	643387577
Product	sensor histidine kinase
Protein accession	YP_002272030
Protein GI	209398684
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAACGCT GGCCCGTTTT TCCCCGCTCA TTACGACAAC TGGTAATGCT GGCATTTTTG 
CTGATTCTGC TGCCCCTGTT GGTGCTGGCA TGGCAAGCCT GGCAAAGCCT GAATGCGCTT 
AGCGACCAGG CGGCGCTGGT CAACCGCACC ACGCTTATCG ATGCCCGGCG CAGCGAAGCA 
ATGACCAACG CGGCGCTGGA GATGGAGCGT AGCTACCGTC AGTATTGCGT GCTGGATGAC 
CCTACGCTTG CGAAGGTTTA TCAAAGCCAG CGCAAGCGTT ACAGCGAAAT GCTCGATGCC 
CACGCAGGCG TACTGCCAGA CGATAAACTT TACCAGGCAT TGCGTCAGGA CTTGAACAAT 
CTGGCCCAAC TTCAGTGCAA CAACAGTGGT CCCGATGCTG CTGCTGCCGC GCGTCTGGAA 
GCCTTTGCCA GTGCCAATAC CGAAATGGTA CAGGCCACGC GCACAGTAGT GTTCTCTCGT 
GGGCAGCAAC TTCAGCGTGA AATCGCCGAA CGTGGGCAAT ATTTTGGTTG GCAATCGCTG 
GTGCTATTTC TGGTGAGTCT GGTAATGGTA CTGCTTTTCA CGCGGATGAT TATCGGGCCG 
GTGAAAAATA TTGAACGGAT GATCAATCGG TTGGGGGAAG GGCGTTCTCT GGGCAATAGC 
GTTTCGTTCA GTGGACCGAG CGAGTTACGC TCGGTTGGGC AACGTATTCT TTGGTTAAGT 
GAGCGCCTGT CATGGCTGGA ATCCCAACGC CATCAATTTT TAAGACATTT ATCTCATGAA 
TTAAAAACGC CACTGGCGAG TATGCGCGAG GGCACTGAAT TACTGGCTGA TCAGGTTGTC 
GGGCCGCTTA CGCCAGAGCA AAAAGAGGTG GTGAGCATTC TTGATAGCAG CAGCCGCAAT 
TTGCAAAAAC TGATCGAACA ACTGCTTGAT TACAACCGTA AACAGGCGGA CAGTGCGGTG 
GAACTAGATA ATGTTGAGTT AGCACCGCTG GTGGAGACAG TAGTTTCTGC TCATAGCCTG 
CCCGCACGGG CTAAAATGAT GCATACCGAC GTCGATCTCA AAGCAACAGC TTGCCTGGCG 
GAGCCAATGC TGCTGATGAG CGTACTGGAT AATCTTTACT CCAATGCGGT GCACTACGGG 
GCTGAATCCG GTAACATTTG CCTTCGCAGC AGTTTACATG GTGCGCGGGT TTATATTGAT 
GTCATCAATA CAGGCACGCC CATTCCGCAA GAGGAACGCG CCATGATCTT CGAACCCTTT 
TTTCAGGGAA GCCACCAGCG AAAAGGGGCG GTGAAGGGCA GCGGTCTGGG ATTAAGCATT 
GCCAGGGATT GTATTCGCCG TATGCAAGGG GAACTGTATC TGGTCGACGA GAGCGGGCAA 
GACGTTTGTT TCCGCATTGA ATTACCGTCG TCGAAAAACA CGAAATAA

Protein sequence

MKRWPVFPRS LRQLVMLAFL LILLPLLVLA WQAWQSLNAL SDQAALVNRT TLIDARRSEA 
MTNAALEMER SYRQYCVLDD PTLAKVYQSQ RKRYSEMLDA HAGVLPDDKL YQALRQDLNN 
LAQLQCNNSG PDAAAAARLE AFASANTEMV QATRTVVFSR GQQLQREIAE RGQYFGWQSL 
VLFLVSLVMV LLFTRMIIGP VKNIERMINR LGEGRSLGNS VSFSGPSELR SVGQRILWLS 
ERLSWLESQR HQFLRHLSHE LKTPLASMRE GTELLADQVV GPLTPEQKEV VSILDSSSRN 
LQKLIEQLLD YNRKQADSAV ELDNVELAPL VETVVSAHSL PARAKMMHTD VDLKATACLA 
EPMLLMSVLD NLYSNAVHYG AESGNICLRS SLHGARVYID VINTGTPIPQ EERAMIFEPF 
FQGSHQRKGA VKGSGLGLSI ARDCIRRMQG ELYLVDESGQ DVCFRIELPS SKNTK