Gene EcSMS35_1486 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1486
Symbol	aroH
ID	6145865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1469263
End bp	1470309
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	641616364
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001743544
Protein GI	170681321
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.803184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA CTGACGAACT CCGTACTGCG CGTATTGAGA GCCTGGTAAC GCCCGCCGAA 
CTCGCGCTAC GGTATCCCGT AACGCCTGGC GTCGCCACCC ATGTCACCGA CTCCCGCCGC 
AGAATTGAAA AAATACTGAA TGGTGAAGAT AAGCGACTGT TGGTCATTAT TGGCCCCTGC 
TCGATCCACG ATCTCACCGC TGCAATGGAG TACGCCACCC GTCTGCAGTC GCTGCGCAAC 
CAGTACCAGT CACGGCTGGA AATCGTAATG CGCACCTATT TTGAAAAACC ACGAACTGTT 
GTCGGCTGGA AAGGACTCAT CTCCGATCCA GATTTAAACG GTAGCTATCG GGTAAATCAC 
GGTCTGGAGC TGGCGCGCAA ATTACTTTTA CAGGTAAATG AGCTGGGCGT CCCTACCGCG 
ACTGAGTTCC TCGATATGGT GACCGGTCAG TTTATTGCTG ATTTAATCAG TTGGGGCGCG 
ATTGGCGCTC GTACTACCGA AAGTCAGATC CACCGCGAAA TGGCTTCAGC ACTCTCCTGT 
CCGGTAGGTT TTAAAAATGG TACCGATGGC AACACGCGGA TTGCCGTGGA TGCTATCCGC 
GCAGCCCGCG CCAGCCATAT GTTCCTCTCA CCAGACAAAA ACGGTCAGAT GACCATCTAT 
CAGACCAGTG GCAACCCGTA TGGCCATATT ATTATGCGTG GCGGCAAAAA ACCGAATTAC 
CATGCCGATG ATATCGCCGC AGCCTGCGAT ACGCTGCACG AGTTTGATTT ACCTGAACAT 
CTGGTGGTGG ATTTCAGCCA CGGTAACTGC CAGAAGCAGC ACCGTCGCCA GTTAGAAGTT 
TGTGAGGATA TTTGTCAGCA AATCCGCAAT GGCTCTACGG CGATTGCTGG AATTATGGCG 
GAAAGTTTCC TGCGCGAAGG AACGCAAAAA ATCGTCGGCG GTCAGCCGCT CACTTACGGT 
CAATCGATTA CCGACCCGTG TCTGGGCTGG GAAGATACCG AACGCCTGGT CGAAAAACTC 
GCCTCTGCGG TTGATACCCG CTTCTGA

Protein sequence

MNRTDELRTA RIESLVTPAE LALRYPVTPG VATHVTDSRR RIEKILNGED KRLLVIIGPC 
SIHDLTAAME YATRLQSLRN QYQSRLEIVM RTYFEKPRTV VGWKGLISDP DLNGSYRVNH 
GLELARKLLL QVNELGVPTA TEFLDMVTGQ FIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAVDAIR AARASHMFLS PDKNGQMTIY QTSGNPYGHI IMRGGKKPNY 
HADDIAAACD TLHEFDLPEH LVVDFSHGNC QKQHRRQLEV CEDICQQIRN GSTAIAGIMA 
ESFLREGTQK IVGGQPLTYG QSITDPCLGW EDTERLVEKL ASAVDTRF