Gene EcolC_2258 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2258
Symbol
ID	6067052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2488792
End bp	2489997
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	56%
IMG OID	641601662
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001725221
Protein GI	170020267
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.127272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAAG CCTTTATCTG TGACGGAATT CGTACGCCAA TTGGTCGCTA CGGCGGGGCA 
TTATCAGGTG TTCGGGCTGA CGATCTGGCT GCTATCCCTT TGCGGGAGCT GCTGGTGCGA 
AACCCGCGTC TCGATGCGGA GTGTATCGAT GATGTGATCC TCGGCTGTGC TAATCAGGCG 
GGAGAAGATA ACCGTAACGT AGCCCGGATG GCGACTTTAC TGGCGGGGCT GCCGCAGAGT 
GTTTCCGGCA CAACCATTAA CCGCTTGTGT GGTTCCGGGC TGGACGCACT GGGGTTCGCC 
GCACGGGCGA TTAAAGCGGG CGATGGCGAT TTGCTGATCG CCGGTGGCGT GGAGTCAATG 
TCTCGGGCAC CGTTTGTTAT GGGCAAGGCA ACCAGTGCAT TTTCTCGTCA GGCTGAGATG 
TTTGATACCA CTATTGGCTG GCGATTTGTG AACCCGCTCA TGGCTCAACA ATTTGGAACT 
GACAGCATGC CGGAAACGGC AGAGAATGTA GCTGAACTGT TAAAAATCTC GCGAGAAGAT 
CAAGATAGTT TTGCGCTACG CAGTCAGCAA CGTTCGGCAA AAGCGCAATC TTCAGGCATT 
TTAGCTGAAG AGATTGTTCC GGTTGTGTTG AAAAATAAGA AAGGTGTTGT AACAGAAATA 
CAACATGACG AGCATTTGCG CCCGGAAACG ACGCTGGAAC AGTTACGTGG ACTAAAAGCA 
CCATTTCGTG CCAATGGAGT GATCACCGCA GGCAATGCCT CCGGGGTGAA TGACGGAGCC 
GCTGCGTTGA TTATTGCCAG TGAACAGATG GCAGCAGCGC AAGGACTGAC ACCGCGAGCG 
CGTATCGTAG CCATGGCAAC CGCCGGGGTG GAACCGCGCC TGATGGGGCT TGGTCCGGTG 
CCTGCAACTC GCCGGGTGCT GGAACGCGCG GGGCTGAGTA TTCACGATAT GGACGTGATT 
GAACTGAACG AAGCATTCGC GGCCCAGGCG TTGGGTGTAC TACGCGAATT GGGGCTGCCT 
GATGATGCCC CACATGTTAA CCCCAACGGA GGCGCTATCG CCTTAGGCCA TCCGTTGGGA 
ATGAGTGGTG CCCGCCTGGC ACTGGCTGCC AGCCATGAGC TGCATCGGCG TAACGGTCGT 
TACGCATTGT GCACCATGTG CATCGGTGTC GGTCAGGGCA TCGCCATGAT TCTGGAGCGT 
GTTTGA

Protein sequence

MREAFICDGI RTPIGRYGGA LSGVRADDLA AIPLRELLVR NPRLDAECID DVILGCANQA 
GEDNRNVARM ATLLAGLPQS VSGTTINRLC GSGLDALGFA ARAIKAGDGD LLIAGGVESM 
SRAPFVMGKA TSAFSRQAEM FDTTIGWRFV NPLMAQQFGT DSMPETAENV AELLKISRED 
QDSFALRSQQ RSAKAQSSGI LAEEIVPVVL KNKKGVVTEI QHDEHLRPET TLEQLRGLKA 
PFRANGVITA GNASGVNDGA AALIIASEQM AAAQGLTPRA RIVAMATAGV EPRLMGLGPV 
PATRRVLERA GLSIHDMDVI ELNEAFAAQA LGVLRELGLP DDAPHVNPNG GAIALGHPLG 
MSGARLALAA SHELHRRNGR YALCTMCIGV GQGIAMILER V