Gene EcSMS35_4950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4950
Symbol	creC
ID	6143407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	5063433
End bp	5064857
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	54%
IMG OID	641619753
Product	sensory histidine kinase CreC
Protein accession	YP_001746857
Protein GI	170683413
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.861306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCG GCATGCGGTT GTTGCTGGGC TATTTTTTAC TGGTGGCGGT GGCAGCCTGG 
TTCGTACTGG CCATTTTTGT CAAAGAAGTT AAACCGGGCG TGCGAAGAGC AACGGAGGGG 
ACGTTGATCG ACACCGCAAC GTTGCTGGCG GAGCTGGCGC GTCCCGATTT GCTCTCTGGG 
GACCCAACGC ATGGGCAACT GGCGCAGGCG TTTAATCAGC TACAACATCG CCCGTTTCGC 
GCCAATATCG GTGGCATTAA CAAAGTGCGC AATGAATATC ATGTCTATAT GACCGATGCG 
CAGGGCAAAG TATTGTTCGA TTCGGCAAAT AAAGCCGTTG GACAGGATTA TTCGCGCTGG 
AATGACGTCT GGCTAACGTT GCGTGGTCAG TATGGTGCGC GCAGCACGTT GCAAAATCCT 
GCCGATCCCG AAAGTTCTGT GATGTATGTT GCCGCACCGA TTATGGACGG CTCGCGGCTT 
ATTGGCGTTT TGAGCGTAGG CAAACCGAAC GCGGCGATGG CTCCGGTCAT TAAGCGTAGC 
GAGCGGCGAA TTTTATGGGC CAGCGCCATT TTGTTGGGGA TTGCACTGGT GATTGGCGCA 
GGCATGGTTT GGTGGATCAA CCGCTCTATT GCCCGGCTCA CTCGCTATGC TGATTCCGTC 
ACTGACAATA AGCCCGTTCC TCTCCCCGAT CTCGGTAGTA GCGAGTTGCG TAAACTCGCG 
CAGGCGCTGG AAAGTATGCG CGTGAAGCTG GAAGGGAAAA ACTATATTGA GCAGTATGTT 
TATGCGTTAA CCCATGAGCT AAAAAGCCCA CTGGCGGCGA TTCGTGGCGC GGCGGAAATT 
TTACGCGAAG GTCCGCCGCC GGAAGTGGTG GCTCGTTTTA CTGACAACAT TCTGACGCAA 
AATGCGCGTA TGCAGGCACT GGTGGAAACG TTACTACGCC AGGCAAGACT GGAGAATCGT 
CAGGAAGTCG TTCTGACTGT TGTTGATGTG GCGGCATTAT TCCGCCGCGT CAGCGAAGCG 
CGCACCGTGC AGTTGGCAGA AAAAAAAATC ACTCTGCATG TTATGCCCAC CGAGGTTAAC 
GTTGCTGCTG AACCGACGTT ACTGGAGCAG GCGCTGGGGA ATTTACTGGA TAACGCCATC 
GATTTTACCC CCGAGAGCGG TCGTATAACG CTAAGCGCCG AAGTGGAGCA GGAACACGTC 
ACGCTTAAGG TGCTGGATAC CGGTAGTGGT ATTCCTGACT ACGCGCTTTC ACGTATTTTT 
GAACGCTTTT ACTCTTTGCC GCGTGCAAAT GGGCAAAAAA GCAGCGGTCT GGGGTTGGCG 
TTCGTCAGTG AGGTCGCCCG TTTGTTTAAC GGCGAAGTCA CGCTGCACAA CGTGCAGGAA 
GGTGGCGTGC TGGCCTCGCT TCGACTTCAC CGTCACTTCA CATAG

Protein sequence

MRIGMRLLLG YFLLVAVAAW FVLAIFVKEV KPGVRRATEG TLIDTATLLA ELARPDLLSG 
DPTHGQLAQA FNQLQHRPFR ANIGGINKVR NEYHVYMTDA QGKVLFDSAN KAVGQDYSRW 
NDVWLTLRGQ YGARSTLQNP ADPESSVMYV AAPIMDGSRL IGVLSVGKPN AAMAPVIKRS 
ERRILWASAI LLGIALVIGA GMVWWINRSI ARLTRYADSV TDNKPVPLPD LGSSELRKLA 
QALESMRVKL EGKNYIEQYV YALTHELKSP LAAIRGAAEI LREGPPPEVV ARFTDNILTQ 
NARMQALVET LLRQARLENR QEVVLTVVDV AALFRRVSEA RTVQLAEKKI TLHVMPTEVN 
VAAEPTLLEQ ALGNLLDNAI DFTPESGRIT LSAEVEQEHV TLKVLDTGSG IPDYALSRIF 
ERFYSLPRAN GQKSSGLGLA FVSEVARLFN GEVTLHNVQE GGVLASLRLH RHFT