Gene EcSMS35_0174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0174
Symbol	cdaR
ID	6144567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	192658
End bp	193815
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	53%
IMG OID	641615075
Product	carbohydrate diacid transcriptional activator CdaR
Protein accession	YP_001742291
Protein GI	170679721
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3835] Sugar diacid utilization regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGCT GGCATCTTGA TACCAAAATG GCGCAGGATA TCGTGGCACG TACCATGCGC 
ATCATCGATA CCAATATCAA CGTAATGGAT GCCCGCGGGC GAATTATCGG CAGCGGCGAT 
CGTGAGCGTA TTGGTGAATT GCACGAAGGA GCATTGCTGG TACTTTCACA GGGACGAGTC 
GTCGATATCG ATGACGCGGT GGCACGTCAT CTGCACGGTG TGCGGCAGGG GATTAATCTA 
CCGTTACGGC TGGAAGGTGA AATTGTCGGC GTAATTGGCC TGACAGGTGA ACCAGAGAAT 
CTGCGTAAAT ATGGCGAACT GGTCTGCATG ACGGCTGAAA TGATGCTGGA ACAGTCGCGG 
TTGATGCACC TGTTGGCGCA GGATAGCCGT TTGCGGGAAG AACTGGTGAT GAACCTGATT 
CAGGCTGAGG AGAATACTCC CGCACTTACG GAATGGGCGC AACGGCTGGG GATCGATCTC 
AATCAACCGC GAGTGGTAGC TATTGTTGAG GTCGACAGCG GTCAGCTTGG CGTGGACAGC 
GCAATGGCGG AGTTACAGCA ACTGCAAAAC GCGCTGACTA CGCCCGAGCG TAATAATCTG 
GTGGCAATTG TTTCGCTGAC CGAAATGGTG GTGTTGAAAC CGGCGTTGAA CTCTTTTGGG 
CGCTGGGATG CAGAAGATCA TCGTAAGCGA GTTGAACAAC TGATTACCCG CATGAAAGAG 
TACGGCCAGC TGCGTTTTCG CGTTTCGCTG GGCAACTATT TTACCGGTCC TGGCGGTATT 
GCCCGATCCT ATCGTACGGC GAAAACGACG ATGGTGGTGG GTAAACAGCG GATGCCAGAA 
AGTCGCTGCT ATTTTTATCA GGATCTGATG TTGCCTGTGT TACTCGACAG TTTGCGTGGC 
GACTGGCAGG CCAACGAACT GGCGCGACCG CTGGCGCGGC TGAAAGCGAT GGACAATAAT 
GGTTTACTGC GGCGAACGTT GGCGGCGTGG TTTCGTCACA ATGTGCAACC GCTGGCAACG 
TCAAAGGCGC TGTTTATTCA TCGTAATACT CTGGAGTATC GGCTTAATCG TATATCGGAA 
CTGACCGGGC TTGATTTGGG CAATTTTGAT GACAGGTTGC TGCTGTATGT GGCGTTACAA 
CTGGATGAAG AGCGGTAG

Protein sequence

MAGWHLDTKM AQDIVARTMR IIDTNINVMD ARGRIIGSGD RERIGELHEG ALLVLSQGRV 
VDIDDAVARH LHGVRQGINL PLRLEGEIVG VIGLTGEPEN LRKYGELVCM TAEMMLEQSR 
LMHLLAQDSR LREELVMNLI QAEENTPALT EWAQRLGIDL NQPRVVAIVE VDSGQLGVDS 
AMAELQQLQN ALTTPERNNL VAIVSLTEMV VLKPALNSFG RWDAEDHRKR VEQLITRMKE 
YGQLRFRVSL GNYFTGPGGI ARSYRTAKTT MVVGKQRMPE SRCYFYQDLM LPVLLDSLRG 
DWQANELARP LARLKAMDNN GLLRRTLAAW FRHNVQPLAT SKALFIHRNT LEYRLNRISE 
LTGLDLGNFD DRLLLYVALQ LDEER