Gene EcDH1_2248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2248
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2416380
End bp	2417585
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	56%
IMG OID
Product	beta-ketoadipyl CoA thiolase
Protein accession	ACX39896
Protein GI	260449474
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0780819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGAAG CCTTTATTTG TGACGGAATT CGTACGCCAA TTGGTCGCTA CGGCGGGGCA 
TTATCAAGTG TTCGGGCTGA TGATCTGGCT GCTATCCCTT TGCGGGAACT GCTGGTGCGA 
AACCCGCGTC TCGATGCGGA GTGTATCGAT GATGTGATCC TCGGCTGTGC TAATCAGGCG 
GGAGAAGATA ACCGTAACGT AGCCCGGATG GCGACTTTAC TGGCGGGGCT GCCGCAGAGT 
GTTTCCGGCA CAACCATTAA CCGCTTGTGT GGTTCCGGGC TGGACGCACT GGGGTTTGCC 
GCACGGGCGA TTAAAGCGGG CGATGGCGAT TTGCTGATCG CCGGTGGCGT GGAGTCAATG 
TCACGGGCAC CGTTTGTTAT GGGCAAGGCA GCCAGTGCAT TTTCTCGTCA GGCTGAGATG 
TTCGATACCA CTATTGGCTG GCGATTTGTG AACCCGCTCA TGGCTCAGCA ATTTGGAACT 
GACAGCATGC CGGAAACGGC AGAGAATGTA GCTGAACTGT TAAAAATCTC ACGAGAAGAT 
CAAGATAGTT TTGCGCTACG CAGTCAGCAA CGTACGGCAA AAGCGCAATC CTCAGGCATT 
CTGGCTGAGG AGATTGTTCC GGTTGTGTTG AAAAACAAGA AAGGTGTTGT AACAGAAATA 
CAACATGATG AGCATCTGCG CCCGGAAACG ACGCTGGAAC AGTTACGTGG GTTAAAAGCA 
CCATTTCGTG CCAATGGGGT GATTACCGCA GGCAATGCTT CCGGGGTGAA TGACGGAGCC 
GCTGCGTTGA TTATTGCCAG TGAACAGATG GCAGCAGCGC AAGGACTGAC ACCGCGGGCG 
CGTATCGTAG CCATGGCAAC CGCCGGGGTG GAACCGCGCC TGATGGGGCT TGGTCCGGTG 
CCTGCAACTC GCCGGGTGCT GGAACGCGCA GGGCTGAGTA TTCACGATAT GGACGTGATT 
GAACTGAACG AAGCGTTCGC GGCCCAGGCG TTGGGTGTAC TACGCGAATT GGGGCTGCCT 
GATGATGCCC CACATGTTAA CCCCAACGGA GGCGCTATCG CCTTAGGCCA TCCGTTGGGA 
ATGAGTGGTG CCCGCCTGGC ACTGGCTGCC AGCCATGAGC TGCATCGGCG TAACGGTCGT 
TACGCATTGT GCACCATGTG CATCGGTGTC GGTCAGGGCA TCGCCATGAT TCTGGAGCGT 
GTTTGA

Protein sequence

MREAFICDGI RTPIGRYGGA LSSVRADDLA AIPLRELLVR NPRLDAECID DVILGCANQA 
GEDNRNVARM ATLLAGLPQS VSGTTINRLC GSGLDALGFA ARAIKAGDGD LLIAGGVESM 
SRAPFVMGKA ASAFSRQAEM FDTTIGWRFV NPLMAQQFGT DSMPETAENV AELLKISRED 
QDSFALRSQQ RTAKAQSSGI LAEEIVPVVL KNKKGVVTEI QHDEHLRPET TLEQLRGLKA 
PFRANGVITA GNASGVNDGA AALIIASEQM AAAQGLTPRA RIVAMATAGV EPRLMGLGPV 
PATRRVLERA GLSIHDMDVI ELNEAFAAQA LGVLRELGLP DDAPHVNPNG GAIALGHPLG 
MSGARLALAA SHELHRRNGR YALCTMCIGV GQGIAMILER V