Gene EcHS_A2991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2991
Symbol
ID	5595477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3002732
End bp	3003913
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	53%
IMG OID	640922112
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001459615
Protein GI	157162297
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.00959201
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGACG TTGTGATTGT CGGGGCGTTA CGGACACCTA TCGGCTGCTT TCGCGGTGCG 
TTAGCGGGTC ATTCCGCCGT GGAACTTGGT AGTCTGGTCG TGAAAGCGTT AATAGAACGT 
ACCGGCGTTC CTGCATATGC GGTGGATGAA GTAATTCTTG GTCAGGTGTT GACTGCAGGG 
GCAGGGCAGA ATCCGGCAAG GCAATCGGCT ATTAAAGGTG GTCTGCCTAA TAGCGTTTCT 
GCAATCACGA TTAATGACGT CTGCGGTTCC GGACTTAAAG CACTGCATCT GGCTACTCAG 
GCGATACAGT GTGGCGAGGC TGATATTGTC ATCGCCGGTG GCCAGGAAAA CATGAGCCGC 
GCACCACATG TTCTGACTGA TAGCCGCACC GGTGCACAGC TTGGCAATAG CCAGCTGGTT 
GACAGTCTTG TGCATGATGG GTTATGGGAT GCCTTCAATG ATTATCATAT TGGTGTCACC 
GCCGAAAATC TGGCTCGCGA ATATGGCATC AGCCGTCAAT TGCAGGATGC TTACGCACTT 
AGCTCGCAAC AAAAAGCGCG AGCGGCGATT GACGCCGGAC GATTTAAAGA TGAGATCGTC 
CCGGTAATGA CCCAAAGTAA CGGTCAGACG TTGGTTGTTG ATACCGATGA ACAGCCACGC 
ACTGACGCCA GTGCAGAAGG TTTAGCCCGT TTAAATCCTT CATTTGATAG TCTCGGTTCT 
GTGACAGTGG GTAATGCATC ATCCATAAAC GATGGCGCAG CTGCGGTAAT GATGATGAGC 
GAAGCCAAAG CACGAGCGTT GAATTTACCC GTGCTGGCCC GCATTCGCGC ATTTGCCAGC 
GTTGGTGTAG ATCCGGCATT GATGGGAATT GCGCCGGTGT ATGCGACCCG CCGTTGCCTG 
GAGCGTGTAG GCTGGCAGTT GGCTGATGTC GATCTTATCG AGGCTAATGA AGCGTTTGCT 
GCACAGGCGC TTTCGGTTGG CAAGATGCTT GAGTGGGATG AGCGTCGGGT CAATGTCAAT 
GGTGGTGCGA TCGCACTTGG TCACCCGATA GGCGCTTCCG GTTGCCGAAT CCTGGTTTCT 
CTGGTTCATG AAATGGTGAA ACGTAATGCC CGCAAAGGAC TGGCAACGCT TTGTATCGGC 
GGGGGCCAGG GTGTGGCATT GACCATTGAA CGTGACGAAT AG

Protein sequence

MKDVVIVGAL RTPIGCFRGA LAGHSAVELG SLVVKALIER TGVPAYAVDE VILGQVLTAG 
AGQNPARQSA IKGGLPNSVS AITINDVCGS GLKALHLATQ AIQCGEADIV IAGGQENMSR 
APHVLTDSRT GAQLGNSQLV DSLVHDGLWD AFNDYHIGVT AENLAREYGI SRQLQDAYAL 
SSQQKARAAI DAGRFKDEIV PVMTQSNGQT LVVDTDEQPR TDASAEGLAR LNPSFDSLGS 
VTVGNASSIN DGAAAVMMMS EAKARALNLP VLARIRAFAS VGVDPALMGI APVYATRRCL 
ERVGWQLADV DLIEANEAFA AQALSVGKML EWDERRVNVN GGAIALGHPI GASGCRILVS 
LVHEMVKRNA RKGLATLCIG GGQGVALTIE RDE