Gene EcHS_A4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4068
Symbol	fadA
ID	5595360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4057869
End bp	4059032
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	58%
IMG OID	640923171
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_001460637
Protein GI	157163319
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02445] fatty oxidation complex, beta subunit FadA

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.142998
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGG TTGTCATTGT CGATGCAATT CGCACCCCGA TGGGCCGTTC GAAGGGCGGT 
GCTTTTCGTA ACGTGCGTGC AGAAGATCTC TCCGCTCATT TAATGCGTAG CCTGCTGGCG 
CGTAACCCGG CGCTGGAAGC GGCGGCCCTC GACGATATTT ACTGGGGTTG TGTGCAGCAG 
ACGCTGGAGC AGGGTTTTAA CATCGCCCGT AACGCGGCGC TGCTGGCAGA AGTACCACAC 
TCTGTCCCGG CGGTTACCGT CAATCGCTTG TGTGGTTCAT CCATGCAGGC ACTGCATGAC 
GCAGCACGGA TGATTATGAC CGGCGATGCG CAGGCATGTC TGGTTGGCGG CGTGGAGCAT 
ATGGGCCATG TGCCGATGAG TCACGGCGTC GATTTTCACC CCGGCCTGAG CCGCAATGTC 
GCCAAAGCGG CGGGCATGAT GGGCTTAACA GCAGAAATGC TGGCGCGTAT GCACGGTATC 
AGCCGTGAAA TGCAGGATGC CTTTGCCGCG CGATCGCACG CTCGTGCCTG GGCCGCCACG 
CAGTCGGCCG CATTTAAAAA TGAAATCATC CCGACCGGTG GTCACGATGC CGACGGCGTC 
CTGAAGCAGT TTAATTACGA CGAAGTGATT CGCCCGGAAA CCACCGTGGA AGCCCTCGCC 
ACGCTGCGTC CGGCGTTTGA TCCAGTAAAC GGTACGGTAA CGGCGGGCAC ATCTTCTGCA 
CTTTCCGATG GCGCAGCTGC CATGCTGGTG ATGAGTGAAA GCCGCGCCCA TGAATTAGGT 
CTTAAGCCGC GCGCTCGTGT GCGTTCGATG GCGGTCGTTG GTTGTGACCC ATCGATTATG 
GGTTACGGCC CGGTTCCGGC CTCAAAGCTG GCGCTGAAAA AAGCGGGGCT TTCTGCCAGC 
GATATCGGCG TGTTTGAGAT GAACGAAGCC TTTGCCGCGC AGATCCTGCC GTGCATTAAA 
GATCTCGGGC TAATGGAGCA GATTGACGAG AAGATCAACC TCAATGGTGG CGCGATCGCG 
CTGGGTCATC CGCTGGGTTG TTCCGGTGCG CGTATCAGCA CCACGCTGCT GAATCTGATG 
GAGCGCAAAG ACGTTCAGTT TGGTCTGGCG ACGATGTGTA TCGGTCTGGG TCAGGGTATT 
GCGACGGTGT TTGAGCGGGT TTAA

Protein sequence

MEQVVIVDAI RTPMGRSKGG AFRNVRAEDL SAHLMRSLLA RNPALEAAAL DDIYWGCVQQ 
TLEQGFNIAR NAALLAEVPH SVPAVTVNRL CGSSMQALHD AARMIMTGDA QACLVGGVEH 
MGHVPMSHGV DFHPGLSRNV AKAAGMMGLT AEMLARMHGI SREMQDAFAA RSHARAWAAT 
QSAAFKNEII PTGGHDADGV LKQFNYDEVI RPETTVEALA TLRPAFDPVN GTVTAGTSSA 
LSDGAAAMLV MSESRAHELG LKPRARVRSM AVVGCDPSIM GYGPVPASKL ALKKAGLSAS 
DIGVFEMNEA FAAQILPCIK DLGLMEQIDE KINLNGGAIA LGHPLGCSGA RISTTLLNLM 
ERKDVQFGLA TMCIGLGQGI ATVFERV