Gene EcSMS35_1301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1301
Symbol	cheB
ID	6142801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1290239
End bp	1291288
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	54%
IMG OID	641616179
Product	chemotaxis-specific methylesterase
Protein accession	YP_001743359
Protein GI	170683043
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG2201] Chemotaxis response regulator containing a CheY-like receiver domain and a methylesterase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.00345426
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAAAA TCAGGGTGTT ATCTGTCGAT GATTCGGCAC TGATGCGCCA GATCATGACA 
GAAATCATCA ACAGCCATAG CGACATGGAA ATGGTGGCGA CCGCCCCTGA TCCGCTGGTT 
GCGCGTGATT TGATTAAAAA ATTCAATCCC GATGTATTGA CGCTGGATGT TGAAATGCCG 
CGGATGGACG GACTGGATTT TCTCGAAAAA TTAATGCGTT TGCGTCCAAT GCCCGTTGTG 
ATGGTTTCTT CCCTGACCGG CAAAGGGTCA GAAGTCACGC TGCGCGCGCT GGAGCTGGGG 
GCGATAGATT TTGTCACCAA ACCGCAACTG GGTATTCGCG AAGGAATGCT GGCGTATAGC 
GAAATGATTG CTGAAAAGGT GCGTACAGCA GCAAAGGCGA GCCTTGCAGC ACATAAGCCA 
TTGTCGGCAC CGACAACGCT GAAGGCAGGG CCGTTGTTGA GTTCTGAAAA ACTGATTGCG 
ATTGGTGCTT CAACGGGGGG AACTGAGGCA ATTCGTCACG TGCTGCAACC GTTGCCGCTT 
TCCAGCCCGG CACTGTTAAT TACCCAGCAT ATGCCGCCCG GTTTCACCCG CTCTTTTGCC 
GACAGACTTA ATAAGCTTTG CCAGATCGGG GTTAAAGAAG CCGAAGACGG AGAACGTGTC 
TTACCGGGGC ATGCCTATAT TGCGCCGGGC GATCGGCATA TGGAGCTGGC GCGTAGTGGC 
GCAAATTACC AAATCAAAAT TCACGATGGC CCGGCGGTTA ACCGTCATCG GCCTTCGGTA 
GATGTGTTGT TCCATTCTGT CGCCAAACAG GCGGGGCGTA ATGCGGTTGG GGTGATCCTG 
ACCGGTATGG GCAACGACGG TGCGGCGGGA ATGTTGGCGA TGCGTCAGGC GGGGGCATGG 
ACCCTTGCGC AAAACGAAGC AAGTTGCGTG GTGTTCGGCA TGCCGCGCGA GGCCATCAAT 
ATGGGTGGTG TCTGCGAAGT GATCGATCTT AGCCAGGTAA GCCAGCAAAT GTTGGCAAAA 
ATTAGTGCCG GACAGGCGAT ACGTATTTAA

Protein sequence

MSKIRVLSVD DSALMRQIMT EIINSHSDME MVATAPDPLV ARDLIKKFNP DVLTLDVEMP 
RMDGLDFLEK LMRLRPMPVV MVSSLTGKGS EVTLRALELG AIDFVTKPQL GIREGMLAYS 
EMIAEKVRTA AKASLAAHKP LSAPTTLKAG PLLSSEKLIA IGASTGGTEA IRHVLQPLPL 
SSPALLITQH MPPGFTRSFA DRLNKLCQIG VKEAEDGERV LPGHAYIAPG DRHMELARSG 
ANYQIKIHDG PAVNRHRPSV DVLFHSVAKQ AGRNAVGVIL TGMGNDGAAG MLAMRQAGAW 
TLAQNEASCV VFGMPREAIN MGGVCEVIDL SQVSQQMLAK ISAGQAIRI