Gene EcHS_A3155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3155
Symbol
ID	5593625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3168187
End bp	3169917
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	53%
IMG OID	640922275
Product	acyl-CoA synthetase
Protein accession	YP_001459773
Protein GI	157162455
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTGTATA TGTCTAATAA AATCTTTACG CATTCCCTAC CTATGCGCTA TGCCGATTTT 
CCAACGCTGG TTGATGCTTT GGACTACGCC GCTCTGAGTA GCGCCGGAAT GAATTTTTAT 
GACAGACGTT GCCAACTTGA AGATCAACTG GAATATCAGA CGTTAAAAGC ACGTGCCGAA 
GCTGTTGCGA AGCGGTTGTT ATCGCTGAAC CTGAAAAAAG GCGATCGCGT GGCACTGATT 
GCCGAAACAA GTAGCGGGTT CGTAGAGGCT TTTTTTGTCT GCCAGTATGC CGGCTTAGTC 
GCCGTCCCGT TGGCGATTCC AATGGGCGTT GGTCAGCGGG ATTCCTGGAG CGCCAAATTG 
CAGGGTTTAC TGGCAAGTTG CCAGCCCGCA GCCATTATCA CTGGTGATGA GTGGTTGCCA 
CTGGTCAATG CCGCGACGCA TGACAACCCC GAATTACATG TTTTAAGCCA CGCCTGGTTT 
AAGGCATTAC CGGAAGCCGA TGTTGCGCTC CAGCGTCCAG TTCCGAACGA TATCGCCTAC 
CTCCAGTACA CCTCCGGCAG CACCCGTTTT CCCCGTGGCG TCATTATCAC CCATCGCGAA 
GTAATGGCTA ATCTACGTGC TATAAGCCAC GACGGCATTA AATTACGCCC TGGCGACCGC 
TGCGTCTCCT GGCTGCCTTT CTACCATGAT ATGGGACTGG TCGGCTTTCT CCTGACCCCC 
GTCGCCACGC AGCTTTCAGT AGATTATTTG CGCACTCAGG ATTTTGCCAT GCGTCCTCTG 
CAATGGCTTA AATTGATCAG TAAAAATCGC GGCACCGTTT CCGTTGCGCC GCCGTTTGGC 
TATGAATTGT GCCAGCGCCG CGTGAATGAA AAAGATCTCG CTGAACTGGA TCTTTCCTGC 
TGGCGCGTCG CTGGTATTGG TGCTGAGCCG ATCTCCGCAG AACAACTCCA TCAATTCGCT 
GAATGTTTCC GTCAGGTTAA CTTTGACGAT AAAACGTTCA TGCCGTGCTA CGGACTGGCA 
GAAAATGCGC TGGCTGTCAG CTTCTCTGAT GAAGCCTCCG GGGTTGTGGT TAACGAAGTG 
GATCGCGACA TCCTCGAATA TCAGGGCAAA GCCGTCGCGC CGGGTGCAGA GACACGCGCC 
GTATCGACTT TCGTCAACTG CGGCAAAGCG TTGCCGGAAC ATGGTATTGA AATCCGCAAT 
GAAGCAGGTA TGCCGGTCGC GGAACGTGTG GTAGGCCATA TTTGCATCTC CGGTCCCAGT 
CTGATGAGCG GTTACTTTGG CGACCAGGTT TCGCAAGACG AGATTGCCGC GACGGGCTGG 
TTAGACACCG GCGACCTCGG TTATCTGCTG GACGGTTATC TGTATGTCAC CGGACGCATT 
AAAGATCTGA TTATTATTCG TGGCCGTAAT ATCTGGCCGC AGGATATTGA ATATATTGCG 
GAACAAGAAC CGGAAATTCA TTCTGGCGAT GCGATTGCTT TTGTTACCGC CCAGGAAAAA 
ATCATTTTGC AGATCCAGTG TCGGATCAGC GACGAAGAAC GTCGCGGGCA GCTTATCCAC 
GCGCTGGCGG CACGGATCCA AAGCGAATTT GGCGTGACCG CGGCTATCGA TCTGTTGCCG 
CCCCACAGTA TTCCCCGAAC GTCCTCCGGC AAGCCTGCCC GTGCGGAAGC GAAAAAACGT 
TATCAGAAGG CTTATGCTGC CAGTCTTAAT GTGCAGGAAT CCCTGGCATG A

Protein sequence

MVYMSNKIFT HSLPMRYADF PTLVDALDYA ALSSAGMNFY DRRCQLEDQL EYQTLKARAE 
AVAKRLLSLN LKKGDRVALI AETSSGFVEA FFVCQYAGLV AVPLAIPMGV GQRDSWSAKL 
QGLLASCQPA AIITGDEWLP LVNAATHDNP ELHVLSHAWF KALPEADVAL QRPVPNDIAY 
LQYTSGSTRF PRGVIITHRE VMANLRAISH DGIKLRPGDR CVSWLPFYHD MGLVGFLLTP 
VATQLSVDYL RTQDFAMRPL QWLKLISKNR GTVSVAPPFG YELCQRRVNE KDLAELDLSC 
WRVAGIGAEP ISAEQLHQFA ECFRQVNFDD KTFMPCYGLA ENALAVSFSD EASGVVVNEV 
DRDILEYQGK AVAPGAETRA VSTFVNCGKA LPEHGIEIRN EAGMPVAERV VGHICISGPS 
LMSGYFGDQV SQDEIAATGW LDTGDLGYLL DGYLYVTGRI KDLIIIRGRN IWPQDIEYIA 
EQEPEIHSGD AIAFVTAQEK IILQIQCRIS DEERRGQLIH ALAARIQSEF GVTAAIDLLP 
PHSIPRTSSG KPARAEAKKR YQKAYAASLN VQESLA