Gene EcHS_A1484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1484
Symbol	pcaF
ID	5591519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1484086
End bp	1485291
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	56%
IMG OID	640920641
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001458197
Protein GI	157160879
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGAAG CCTTTATCTG TGACGGAATT CGTACGCCAA TTGGTCGCTA CGGCGGGGCA 
TTATCAGGTG TTCGGGCTGA CGATCTGGCT GCTATCCCTT TGCGGGAGCT GCTGGTGCGA 
AACCCGCGTC TCGATGCGGA GTGTATCGAT GATGTGATCC TCGGCTGTGC TAATCAGGCG 
GGAGAAGATA ACCGTAACGT AGCCCGGATG GCGACTTTAC TGGCGGGGCT GCCGCAGAGT 
GTTTCCGGCA CAACCATTAA CCGCTTGTGT GGTTCCGGGC TGGACGCACT GGGGTTCGCC 
GCACGGGCGA TTAAAGCGGG CGATGGCGAT TTGCTGATCG CCGGTGGCGT GGAGTCAATG 
TCTCGGGCAC CGTTTGTTAT GGGCAAGGCA ACCAGTGCAT TTTCTCGTCA GGCTGAGATG 
TTTGATACCA CTATTGGCTG GCGATTTGTG AACCCGCTCA TGGCTCAACA ATTTGGAACT 
GACAGCATGC CGGAAACGGC AGAGAATGTA GCTGAACTGT TAAAAATCTC GCGAGAAGAT 
CAAGATAGTT TTGCGCTACG CAGTCAGCAA CGTTCGGCAA AAGCGCAATC TTCAGGCATT 
TTAGCTGAAG AGATTGTTCC GGTTGTGTTG AAAAATAAGA AAGGTGTTGT AACAGAAATA 
CAACATGACG AGCATTTGCG CCCGGAAACG ACGCTGGAAC AGTTACGTGG ACTAAAAGCA 
CCATTTCGTG CCAATGGAGT GATCACCGCA GGCAATGCCT CCGGGGTGAA TGACGGAGCC 
GCTGCGTTGA TTATTGCCAG TGAACAGATG GCAGCAGCGC AAGGACTGAC ACCGCGAGCG 
CGTATCGTAG CCATGGCAAC CGCCGGGGTG GAACCGCGCC TGATGGGGCT TGGTCCGGTG 
CCTGCAACTC GCCGGGTGCT GGAACGCGCG GGGCTGAGTA TTCACGATAT GGACGTGATT 
GAACTGAACG AAGCATTCGC GGCCCAGGCG TTGGGTGTAC TACGCGAATT GGGGCTGCCT 
GATGATGCCC CACATGTTAA CCCCAACGGA GGCGCTATCG CCTTAGGCCA TCCGTTGGGA 
ATGAGTGGTG CCCGCCTGGC ACTGGCTGCC AGCCATGAGC TGCATCGGCG TAACGGTCGT 
TACGCATTGT GCACCATGTG CATCGGTGTC GGTCAGGGCA TCGCCATGAT TCTGGAGCGT 
GTTTGA

Protein sequence

MREAFICDGI RTPIGRYGGA LSGVRADDLA AIPLRELLVR NPRLDAECID DVILGCANQA 
GEDNRNVARM ATLLAGLPQS VSGTTINRLC GSGLDALGFA ARAIKAGDGD LLIAGGVESM 
SRAPFVMGKA TSAFSRQAEM FDTTIGWRFV NPLMAQQFGT DSMPETAENV AELLKISRED 
QDSFALRSQQ RSAKAQSSGI LAEEIVPVVL KNKKGVVTEI QHDEHLRPET TLEQLRGLKA 
PFRANGVITA GNASGVNDGA AALIIASEQM AAAQGLTPRA RIVAMATAGV EPRLMGLGPV 
PATRRVLERA GLSIHDMDVI ELNEAFAAQA LGVLRELGLP DDAPHVNPNG GAIALGHPLG 
MSGARLALAA SHELHRRNGR YALCTMCIGV GQGIAMILER V