Gene EcolC_1311 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1311
Symbol	fadI
ID	6068500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1440400
End bp	1441710
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	55%
IMG OID	641600733
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_001724304
Protein GI	170019350
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02446] fatty oxidation complex, beta subunit FadI

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.995653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCAGG TTTTACCGCT GGTTACCCGC CAGGGCGATC GTATCGCCAT TGTTAGCGGT 
TTACGTACGC CTTTTGCCCG CCAGGCGACG GCTTTTCATG GCATTCCCGC GGTTGATTTA 
GGGAAGATGG TGGTAGGCGA ACTGCTGGCA CGCAGCGAGA TCCCCGCTGA AGTGATTGAA 
CAACTGGTCT TTGGTCAGGT CGTACAAATG CCTGAAGCCC CCAACATTGC GCGTGAAATT 
GTTCTCGGTA CGGGAATGAA TGTGCATACC GATGCTTACA GCGTCAGCCG CGCTTGCGCT 
ACCAGTTTCC AGGCAGTTGC AAACGTCGCA GAAAGCCTGA TGGCGGGAAC TATTCGAGCG 
GGGATTGCCG GTGGGGCAGA TTCCTCTTCC GTATTGCCAA TTGGCGTCAG TAAAAAACTG 
GCGCGCGTGC TGGTTGATGT CAACAAAGCT CGAACCATGA GCCAGCGACT GAAACTCTTC 
TCTCGCCTGC GTTTGCGCGA CTTAATGCCC GTACCGCCTG CGGTAGCAGA ATATTCTACC 
GGCTTGCGGA TGGGTGACAC CGCAGAGCAA ATGGCGAAAA CCTACGGCAT CACCCGAGAA 
CAGCAAGATG CACTGGCCCA CCGTTCGCAT CAGCGTGCTG CTCAGGCATG GTCAGACGGG 
AAACTCAAAG AAGAGGTGAT GACTGCCTTT ATCCCTCCTT ATAAACAACC GTTTGTCGAA 
GACAACAATA TTCGCGGTAA TTCCTCGCTT GCTGATTACG CAAAGTTGCG TCCGGCGTTT 
GATCGTAAAC ACGGGACGGT AACGGCAGCA AACAGTACGC CGCTGACCGA TGGCGCAGCG 
GCGGTGATCC TGATGACCGA ATCGCGGGCG AAAGAATTAG GGCTGGTACC GCTGGGGTAT 
CTGCGCAGCT ACGCATTTAC TGCGATAGAT GTCTGGCAGG ACATGTTGCT CGGTCCAGCC 
TGGTCAACAC CGCTGGCGCT GGAACGTGCC GGTTTGACGA TGAGCGATCT GACATTGATC 
GATATGCACG AAGCCTTTGC AGCTCAGACA CTGGCGAATA TTCAGTTGCT GGGTAGTGAA 
CGTTTTGCTC GTGAAGTACT GGGGCGTGCA CATGCCACTG GCGAAGTGGA CGATAGCAAA 
TTTAACGTGC TTGGCGGTTC GATTGCTTAT GGGCATCCCT TCGCGGCGAC CGGCGCGCGG 
ATGATTACCC AGACACTGCA TGAACTTCGC CGTCGCGGCG GTGGATTTGG TTTAGTTACC 
GCCTGTGCTG CCGGTGGGCT TGGCGCGGCA ATGGTTCTGG AGGCGGAATA A

Protein sequence

MGQVLPLVTR QGDRIAIVSG LRTPFARQAT AFHGIPAVDL GKMVVGELLA RSEIPAEVIE 
QLVFGQVVQM PEAPNIAREI VLGTGMNVHT DAYSVSRACA TSFQAVANVA ESLMAGTIRA 
GIAGGADSSS VLPIGVSKKL ARVLVDVNKA RTMSQRLKLF SRLRLRDLMP VPPAVAEYST 
GLRMGDTAEQ MAKTYGITRE QQDALAHRSH QRAAQAWSDG KLKEEVMTAF IPPYKQPFVE 
DNNIRGNSSL ADYAKLRPAF DRKHGTVTAA NSTPLTDGAA AVILMTESRA KELGLVPLGY 
LRSYAFTAID VWQDMLLGPA WSTPLALERA GLTMSDLTLI DMHEAFAAQT LANIQLLGSE 
RFAREVLGRA HATGEVDDSK FNVLGGSIAY GHPFAATGAR MITQTLHELR RRGGGFGLVT 
ACAAGGLGAA MVLEAE