Gene EcSMS35_2369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2369
Symbol	atoC
ID	6144692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2405463
End bp	2406848
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	49%
IMG OID	641617242
Product	acetoacetate metabolism regulatory protein AtoC
Protein accession	YP_001744414
Protein GI	170681202
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0790211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCTA TTAATCGCAT CCTTATTGTG GATGATGAAG ATAATGTTCG CCGTATGCTG 
AGCACCGCTT TTGCACTACA AGGATTCGAA ACACATTGTG CGAACAACGG GCGCACAGCA 
TTACACCTGT TTGCCGATAT TCACCCTGAC GTGGTGTTGA TGGATATCCG CATGCCAGAG 
ATGGACGGCA TCAAGGCACT CAAGGAGATG CGCAGCCATG AGACCCGGAC ACCCGTTATT 
CTGATGACGG CCTATGCTGA AGTGGAAACC GCCGTCGAAG CACTACGCTG CGGAGCCTTC 
GACTATGTTA TCAAACCGTT TGATCTCGAT GAGTTGAATT TAATCGTTCA GCGCACTTTA 
CAACTCCAGT CAATGAAAAA AGAGATCCGT CATCTGCACC AGGCACTGAG CACCAGCTGG 
CAATGGGGGC ACATTCTCAC CAACAGCCCG GCGATGATGG ACATCTGCAA AGACACCGCC 
AAAATTGCCC TTTCTCAGGC CAGCGTCTTG ATTAGCGGTG AAAGCGGCAC CGGGAAAGAG 
TTGATTGCCA GAGCGATTCA CTACAATTCG CGGAGGGCAA AGGGGCCGTT CATTAAAGTC 
AACTGCGCGG CACTGCCGGA ATCGTTGCTC GAAAGTGAAC TGTTTGGTCA TGAAAAAGGC 
GCATTTACTG GTGCACAAAC CTTACGTCAG GGATTATTTG AACGTGCCAA CGAAGGTACT 
CTGCTCCTCG ACGAAATTGG CGAAATGCCG CTGGTACTGC AAGCCAAATT ACTACGCATT 
CTGCAGGAAC GGGAATTTGA ACGGATTGGC GGTCATCAGA CCATAAAAGT TGATATCCGC 
ATCATTGCTG CCACCAACCG CGACTTGCAG GCAATGGTGA AAGAAGGCAC CTTCCGTGAA 
GATCTCTTTT ATCGCCTTAA CGTTATTCAT TTAATACTAC CGCCTCTGCG CGATCGCCGG 
GAAGATATTT CCCTGTTAGC TAATCACTTT TTGCAAAAAT TCAGTAGTGA GAATCAGCGC 
GATATTATCG ACATCGATCC GATGGCAATG TCGCTGCTTA CCGCCTGGTC ATGGCCGGGT 
AATATTCGAG AGCTTTCCAA CGTCATTGAA CGCGCCGTCG TGATGAACTC AGGCCCGATC 
ATTTTCTCTG AGGATCTTCC GCCGCAGATT CGTCAGCCAG TCTGTAATGC TGGTGAGGCA 
AAAACAGCCC CTGTCGGTGA GCGTAATTTA AAAGAGGAAA TTAAACGCGT CGAAAAACGC 
ATCATTATGG AAGTGCTGGA ACAACAAGAA GGAAACCGAA CCCGCACTGC GTTAATGCTG 
GGCATCAGTC GCCGTGCATT GATGTATAAA CTCCAGGAAT ACGGTATCGA TCCGGCGGAT 
GTATAA

Protein sequence

MTAINRILIV DDEDNVRRML STAFALQGFE THCANNGRTA LHLFADIHPD VVLMDIRMPE 
MDGIKALKEM RSHETRTPVI LMTAYAEVET AVEALRCGAF DYVIKPFDLD ELNLIVQRTL 
QLQSMKKEIR HLHQALSTSW QWGHILTNSP AMMDICKDTA KIALSQASVL ISGESGTGKE 
LIARAIHYNS RRAKGPFIKV NCAALPESLL ESELFGHEKG AFTGAQTLRQ GLFERANEGT 
LLLDEIGEMP LVLQAKLLRI LQEREFERIG GHQTIKVDIR IIAATNRDLQ AMVKEGTFRE 
DLFYRLNVIH LILPPLRDRR EDISLLANHF LQKFSSENQR DIIDIDPMAM SLLTAWSWPG 
NIRELSNVIE RAVVMNSGPI IFSEDLPPQI RQPVCNAGEA KTAPVGERNL KEEIKRVEKR 
IIMEVLEQQE GNRTRTALML GISRRALMYK LQEYGIDPAD V