Gene EcHS_A2493 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2493
Symbol	fadI
ID	5594961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2500780
End bp	2502090
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	55%
IMG OID	640921614
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_001459148
Protein GI	157161830
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02446] fatty oxidation complex, beta subunit FadI

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCAGG TTTTACCGCT GGTTACCCGC CAGGGCGATC GTATCGCCAT TGTTAGCGGT 
TTACGTACGC CTTTTGCCCG CCAGGCGACG GCTTTTCATG GCATTCCCGC GGTTGATTTA 
GGGAAGATGG TGGTAGGCGA ACTGCTGGCA CGCAGCGAGA TCCCCGCTGA AGTGATTGAA 
CAACTGGTCT TTGGTCAGGT CGTACAAATG CCTGAAGCCC CCAACATTGC GCGTGAAATT 
GTTCTCGGTA CGGGAATGAA TGTGCATACC GATGCTTACA GCGTCAGCCG CGCTTGCGCT 
ACCAGTTTCC AGGCAGTTGC AAACGTCGCA GAAAGCCTGA TGGCGGGAAC TATTCGAGCG 
GGGATTGCCG GTGGGGCAGA TTCCTCTTCC GTATTGCCAA TTGGCGTCAG TAAAAAACTG 
GCGCGCGTGC TGGTTGATTT CAACAAAGCT CGAATCATGA GACAGCGCCT GAAACTCTTC 
TCTCGCCTGC GTTTGCGCGA CTTAATGCCC GTACCGCCTG CGGTAGCAGA ATATTCTACC 
GGCTTGCGGA TGGGTGACAC CGCAGAGCAA ATGGCGAAAA CCTACGGCAT CACCCGAGAA 
CAGCAAGATG CATTAGCGCA CCGTTCGCAT CAGCGTGCCG CTCAGGCATG GTCAGACGGA 
AAACTCAAAG AAGAGGTGAT GACTGCCTTT ATCCCTCCTT ATAAACAACC GCTTGTCGAA 
GACAACAATA TTCGCGGTAA TTCCTCGCTT GCCGATTACG CAAAGCTGCG CCCGGCGTTT 
GATCGCAAAC ACGGAACGGT AACGGCGGCA AACAGTACGC CGCTGACCGA TGGCGCGGCA 
GCGGTGATCC TGATGACTGA ATCCCGGGCG AAAGAATTAG GGCTGGTGCC GCTGGGGTAT 
CTGCGCAGCT ACGCATTTAC TGCGATTGAT GTCTGGCAGG ACATGTTGCT CGGTCCAGCC 
TGGTCAACAC CGCTGGCGCT GGAGCGTGCC GGTTTGACGA TGAGCGATCT GACATTGATC 
GATATGCACG AAGCCTTTGC AGCTCAGACA CTGGCGAATA TTCAGTTGCT GGGTAGTGAA 
CGTTTTGCTC GTGATGTACT GGGGCGTGCA CATGCCACTG GCGAAGTGGA CGATAGCAAA 
TTTAACGTGC TTGGCGGTTC GATTGCTTAC GGACATCCCT TCGCGGCGAC CGGCGCACGG 
ATGATTACCC AGACATTGCA TGAACTTCGC CGTCGCGGCG GTGGATTTGG TTTAGTTACC 
GCCTGTGCTG CCGGTGGGCT TGGCGCGGCA ATGGTTCTGG AGGCGGAATA A

Protein sequence

MGQVLPLVTR QGDRIAIVSG LRTPFARQAT AFHGIPAVDL GKMVVGELLA RSEIPAEVIE 
QLVFGQVVQM PEAPNIAREI VLGTGMNVHT DAYSVSRACA TSFQAVANVA ESLMAGTIRA 
GIAGGADSSS VLPIGVSKKL ARVLVDFNKA RIMRQRLKLF SRLRLRDLMP VPPAVAEYST 
GLRMGDTAEQ MAKTYGITRE QQDALAHRSH QRAAQAWSDG KLKEEVMTAF IPPYKQPLVE 
DNNIRGNSSL ADYAKLRPAF DRKHGTVTAA NSTPLTDGAA AVILMTESRA KELGLVPLGY 
LRSYAFTAID VWQDMLLGPA WSTPLALERA GLTMSDLTLI DMHEAFAAQT LANIQLLGSE 
RFARDVLGRA HATGEVDDSK FNVLGGSIAY GHPFAATGAR MITQTLHELR RRGGGFGLVT 
ACAAGGLGAA MVLEAE