Gene ECH74115_3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3840
Symbol	aroF
ID	6970104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3564308
End bp	3565378
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	643387623
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002272072
Protein GI	209398239
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00124631
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAG ACGCGCTGAA TAACGTACAT ATTACCGACG AACAGGTTTT AATGACTCCG 
GCACAACTGA AGGCCGCTTT TCCATTAAGC CTGCAACAAG AAGCCCAGAT TGCTGACTCG 
CGTAAAACCA TTTCAGATAT TATCGCCGGG CGCGATCCTC GTCTGCTGGT AGTATGTGGC 
CCTTGTTCCA TTCATGATCC GGAAACTGCT CTGGAATATG CTCGTCGATT TAAAGCCCTT 
GCCGCAGAGG TCAGCGATAG CCTCTATCTG GTAATGCGCG TCTATTTTGA AAAACCCCGT 
ACCACTGTCG GCTGGAAAGG GTTAATTAAC GATCCCCATA TGGATGGCTC TTTTGATGTA 
GAAGCCGGGC TGCAGATCGC GCGTAAATTG CTGCTTGAGC TGGTGAATAT GGGACTGCCA 
CTGGCGACGG AAGCGTTAGA TCCGAATAGC CCGCAATACC TGGGCGATCT GTTTAGCTGG 
TCAGCAATTG GTGCTCGTAC AACGGAATCG CAAACTCACC GTGAAATGGC CTCCGGGCTT 
TCCATGCCGG TTGGCTTTAA AAACGGCACC GACGGCAGTC TGGCAACAGC AATTAACGCT 
ATGCGCGCCG CCGCCCAGCC GCACCGTTTT GTTGGCATTA ACCAGGCAGG GCAGGTTGCG 
TTGCTACAAA CTCAGGGGAA TCCGGACGGG CATGTCATCC TGCGCGGTGG TAAAGCGCCG 
AACTATAGCC CTGCGGATGT TGCGCAATGT GAAAAAGAGA TGGAACAGGC GGGACTGCGC 
CCGTCTCTGA TGGTAGATTG CAGCCACGGT AATTCCAATA AAGATTATCG CCGTCAGCCT 
GCGGTGGCAG AATCCGTGGT TGCTCAAATC AAAGATGGCA ATCGCTCAAT TATTGGTCTG 
ATGATCGAAA GTAATATCCA CGAGGGCAAT CAGTCTTCCG AGCAACCGCG CAGTGAAATG 
AAATACGGTG TATCCGTAAC CGATGCCTGC ATTAGCTGGG AAATGACCGA TGCCTTGCTG 
CGTGAAATTC ATCAGGATCT GAACGGGCAG CTGACGGCTC GCGTGGCTTA A

Protein sequence

MQKDALNNVH ITDEQVLMTP AQLKAAFPLS LQQEAQIADS RKTISDIIAG RDPRLLVVCG 
PCSIHDPETA LEYARRFKAL AAEVSDSLYL VMRVYFEKPR TTVGWKGLIN DPHMDGSFDV 
EAGLQIARKL LLELVNMGLP LATEALDPNS PQYLGDLFSW SAIGARTTES QTHREMASGL 
SMPVGFKNGT DGSLATAINA MRAAAQPHRF VGINQAGQVA LLQTQGNPDG HVILRGGKAP 
NYSPADVAQC EKEMEQAGLR PSLMVDCSHG NSNKDYRRQP AVAESVVAQI KDGNRSIIGL 
MIESNIHEGN QSSEQPRSEM KYGVSVTDAC ISWEMTDALL REIHQDLNGQ LTARVA