Gene EcE24377A_0167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0167
Symbol	cdaR
ID	5587960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	183833
End bp	184963
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	53%
IMG OID	640923896
Product	carbohydrate diacid transcriptional activator CdaR
Protein accession	YP_001461333
Protein GI	157156858
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3835] Sugar diacid utilization regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAGG ATATCGTGGC ACGTACCATG CGCATCATCG ATACCAATAT CAACGTAATG 
GATGCCCGTG GGCGAATTAT CGGCAGCGGC GATCGTGAGC GTATTGGTGA ATTGCACGAA 
GGTGCATTGC TGGTACTTTC ACAGGGACGA GTCGTCGATA TCGATGACGC GGTGGCACGT 
CATCTGCACG GTGTGCGGCA AGGGATTAAT CTACCGTTAC GGCTGGAAGG TGAAATTGTC 
GGCGTAATTG GCCTGACAGG TGAACCAGAG AATCTGCGTA AATATGGCGA ACTGGTCTGC 
ATGACGGCTG AAATGATGCT GGAACAGTCG CGGTTGATGC ACTTGTTGGC TCAGGATAGC 
CGTTTGCGGG AGGAACTGGT GATGAACCTG ATTCAGGCAG AGGAGAATAC TCCCGCACTT 
ACTGAATGGG CGCAACGGCT GGGGATCGAT CTCAATCAAC CGCGAGTGGT GGCTATTGTT 
GAGGTCGACA GCGGTCAGCT TGGTGTGGAC AGCGCAATGG CGGAGTTACA ACAACTGCAA 
AACGCGCTGA CTACGCCCGA GCGTAATAAT CTGGTGGCGA TTGTCTCGCT AACCGAAATG 
GTGGTGTTGA AACCGGCGTT GAACTCTTTT GGGCGCTGGG ATGCAGAAGA TCATCGTAAG 
CGAGTTGAAC AACTGATTAC CCGCATGAAA GAGTACGGCC AGCTGCGTTT TCGCGTTTCA 
CTGGGCAACT ATTTTACCGG TCCTGGCAGT ATTGCCCGAT CCTATCGTAC GGCGAAAACG 
ACGATGGTGG TGGGTAAACA GCGGATGCCA GAAAGTCGCT GCTATTTTTA TCAGGATCTG 
ATGTTACCTG TGTTACTCGA CAGTTTGCGT GGCGACTGGC AGGCCAACGA ACTGGCGCGA 
CCGCTGGCGC GGCTGAAAGC GATGGACAAT AACGGCTTGC TGCGACGAAC GCTGGCGGCG 
TGGTTTCGTC ACAATGTGCA ACCGCTGGCA ACGTCAAAGG CGTTGTTTAT TCATCGTAAT 
ACTCTGGAGT ATCGGCTTAA TCGTATATCG GAACTGACCG GGCTTGATTT GGGTAATTTT 
GATGACAGGT TGCTGCTGTA TGTGGCGTTG CAGCTGGATG AAGAGCGGTA G

Protein sequence

MAQDIVARTM RIIDTNINVM DARGRIIGSG DRERIGELHE GALLVLSQGR VVDIDDAVAR 
HLHGVRQGIN LPLRLEGEIV GVIGLTGEPE NLRKYGELVC MTAEMMLEQS RLMHLLAQDS 
RLREELVMNL IQAEENTPAL TEWAQRLGID LNQPRVVAIV EVDSGQLGVD SAMAELQQLQ 
NALTTPERNN LVAIVSLTEM VVLKPALNSF GRWDAEDHRK RVEQLITRMK EYGQLRFRVS 
LGNYFTGPGS IARSYRTAKT TMVVGKQRMP ESRCYFYQDL MLPVLLDSLR GDWQANELAR 
PLARLKAMDN NGLLRRTLAA WFRHNVQPLA TSKALFIHRN TLEYRLNRIS ELTGLDLGNF 
DDRLLLYVAL QLDEER