Gene EcHS_A0644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0644
Symbol	entC
ID	5591299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	660966
End bp	662141
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	56%
IMG OID	640919825
Product	isochorismate synthase
Protein accession	YP_001457407
Protein GI	157160089
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACGT CACTGGCTGA GGAAGTACAG CAGACCATGG CAACACTTGC GCCCAATCGC 
TTTTTCTTTA TGTCGCCGTA CCGCAGTTTT ACGACGTCAG GATGTTTCGC CCGCTTCGAT 
GAACCGGCTG TGAACGGGGA TTCGCCCGAC AGTCCCTTCC AGCAAAAACT CGCCGCGCTG 
TTTGCCGATG CCAAAGCGCA GGGCATCAAA AATCCGGTGA TGGTCGGGGC GATTCCCTTC 
GATCCACGTC AGCCTTCGTC GCTGTATATT CCTGAATCCT GGCAGTCGTT CTCCCGTCAG 
GAAAAACAAG CTTCCGCACG CCGTTTCACC CGCAGCCAGT CGCTGAATGT GGTGGAACGC 
CAGGCAATTC CGGAGCAAAC CACGTTTGAA CAGATGGTTG CCCGCGCCGC CGCACTTACC 
GCCACGCCGC AGGTCGACAA AGTGGTGTTG TCACGGTTGA TTGATATCAC CACTGACGCC 
GCCATTGATA GTGGCGTATT GCTGGAACGG TTGATTGCGC AAAACCCGGT TAGTTACAAC 
TTCCATGTTC CGCTGGCTGA TGGTGGCGTC CTGCTGGGGG CCAGCCCGGA ACTGCTGCTA 
CGTAAAGACG GCGAGCGTTT TAGCTCCATT CCGTTAGCCG GTTCCGCGCG TCGTCAGCCG 
GATGAAGTGC TCGATCGCGA AGCAGGTAAT CGTCTGCTGG CGTCAGAAAA AGATCGCCAT 
GAACATGAAC TGGTGACTCA GGCGATGAAA GAGGTACTGC GCGAACGCAG TAGTGAGTTA 
CACGTTCCTT CTTCTCCACA GCTGATCACC ACGCCGACGC TGTGGCATCT CGCAACTCCC 
TTTGAAGGTA AAGCGAATTC GCAAGAAAAC GCACTGACTC TGGCCTGTCT GCTGCATCCG 
ACCCCCGCGC TGAGCGGTTT CCCGCATCAG GCCGCGACCC AGGTTATTGC TGAACTGGAA 
CCGTTCGACC GCGAACTGTT TGGCGGCATT GTGGGTTGGT GTGACAGCGA AGGTAACGGC 
GAATGGGTGG TGACCATCCG CTGCGCGAAG CTGCGGGAAA ATCAGGTGCG TCTGTTTGCC 
GGAGCGGGGA TTGTGCCTGC GTCGTCACCG TTGGGTGAGT GGCGCGAAAC AGGCGTCAAA 
CTTTCTACCA TGTTGAACGT TTTTGGATTG CATTAA

Protein sequence

MDTSLAEEVQ QTMATLAPNR FFFMSPYRSF TTSGCFARFD EPAVNGDSPD SPFQQKLAAL 
FADAKAQGIK NPVMVGAIPF DPRQPSSLYI PESWQSFSRQ EKQASARRFT RSQSLNVVER 
QAIPEQTTFE QMVARAAALT ATPQVDKVVL SRLIDITTDA AIDSGVLLER LIAQNPVSYN 
FHVPLADGGV LLGASPELLL RKDGERFSSI PLAGSARRQP DEVLDREAGN RLLASEKDRH 
EHELVTQAMK EVLRERSSEL HVPSSPQLIT TPTLWHLATP FEGKANSQEN ALTLACLLHP 
TPALSGFPHQ AATQVIAELE PFDRELFGGI VGWCDSEGNG EWVVTIRCAK LRENQVRLFA 
GAGIVPASSP LGEWRETGVK LSTMLNVFGL H