Gene EcolC_1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1121
Symbol
ID	6067978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1221825
End bp	1223252
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID	641600537
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001724115
Protein GI	170019161
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAACGCT GGCCCGTTTT TCCCCGCTCA TTACGACAAC TGGTAATGCT GGCATTTTTG 
CTGATTCTGC TGCCCCTGTT GGTGCTGGCA TGGCAAGCCT GGCAAAGCCT GAATGCGCTT 
AGCGATCAGG CGGCGCTGGT TAACCGCACT ACGCTTATTG ATGCCCGGCG CAGTGAAGCG 
ATGACCAACG CGGCGCTGGA GATGGAGCGT AGTTACCGTC AGTATTGCGT GCTGGACGAC 
CCAACCCTGG CGAAGGTTTA TCAAAGCCAG CGCAAGCGTT ACAGCGAAAT GCTCGATGCC 
CACGCAGGCG TGCTGCCGGA CGATAAACTC TACCAGGCAT TACGTCAGGA TTTGCACAAT 
CTGGCTCAAC TTCAGTGTAA CAACAGCGGT CCCGATGCTG CCGCCGCCGC ACGTCTTGAA 
GCCTTTGCCA GTGCCAATAC CGAAATGGTA CAGGCCACGC GCACAGTGGT GTTCTCTCGT 
GGGCAGCAGC TTCAGCGTGA AATCGCCGAA CGTGGGCAAT ATTTTGGTTG GCAATCGCTG 
GTGCTATTTC TGGTGAGTCT GGTAATGGTA CTGCTTTTCA CGCGGATGAT TATCGGGCCG 
GTGAAAAATA TCGAGCGCAT GATCAACCGT CTGGGGGAAG GGCGTTCTCT GGGCAATAGC 
GTCTCGTTCA GTGGACCGAG CGAGTTACGC TCGGTTGGGC AACGTATTCT TTGGTTAAGT 
GAGCGCCTGT CATGGCTGGA ATCCCAACGC CATCAATTTT TAAGACATTT ATCTCATGAA 
TTAAAAACGC CACTGGCGAG TATGCGCGAG GGCACTGAAT TACTGGCTGA CCAGGTTGTC 
GGGCCGCTTA CGCCAGAGCA AAAAGAGGTG GTGAGCATTC TTGATAGCAG CAGCCGCAAT 
TTGCAAAAAC TGATCGAACA ACTGCTTGAT TACAACCGTA AACAGGCGGA CAGTGCGGTG 
GAACTGGAGA ATGTTGAGTT AGCACCGCTG GTGGAGACAG TGGTTTCTGC TCATAGCCTG 
CCCGCACGGG CTAAAATGAT GCATACCGAC GTCGATCTCA AAGCAACAGC TTGCCTGGCG 
GAGCCAATGC TGCTGATGAG CGTACTGGAT AATCTTTACT CCAATGCGGT GCACTACGGG 
GCTGAATCCG GTAACATTTG CCTTCGCAGC AGTTTACATG GTGCGCGGGT TTATATTGAT 
GTCATCAATA CAGGCACGCC CATTCCGCAA GAGGAACGCG CCATGATCTT CGAACCCTTT 
TTTCAGGGAA GCCACCAGCG AAAAGGGGCG GTGAAGGGCA GCGGTCTGGG ATTAAGCATT 
GCCAGGGATT GTATTCGCCG TATGCAAGGG GAACTGTATC TGGTCGACGA GAGCGGGCAA 
GACGTTTGTT TCCGCATTGA ATTACCGTCG TCGAAAAACA CGAAATAA

Protein sequence

MKRWPVFPRS LRQLVMLAFL LILLPLLVLA WQAWQSLNAL SDQAALVNRT TLIDARRSEA 
MTNAALEMER SYRQYCVLDD PTLAKVYQSQ RKRYSEMLDA HAGVLPDDKL YQALRQDLHN 
LAQLQCNNSG PDAAAAARLE AFASANTEMV QATRTVVFSR GQQLQREIAE RGQYFGWQSL 
VLFLVSLVMV LLFTRMIIGP VKNIERMINR LGEGRSLGNS VSFSGPSELR SVGQRILWLS 
ERLSWLESQR HQFLRHLSHE LKTPLASMRE GTELLADQVV GPLTPEQKEV VSILDSSSRN 
LQKLIEQLLD YNRKQADSAV ELENVELAPL VETVVSAHSL PARAKMMHTD VDLKATACLA 
EPMLLMSVLD NLYSNAVHYG AESGNICLRS SLHGARVYID VINTGTPIPQ EERAMIFEPF 
FQGSHQRKGA VKGSGLGLSI ARDCIRRMQG ELYLVDESGQ DVCFRIELPS SKNTK