Gene EcHS_A2758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2758
Symbol	aroF
ID	5595388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2779693
End bp	2780763
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	640921874
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001459393
Protein GI	157162075
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00000150531
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAG ACGCGCTGAA TAACGTACAT ATTACCGACG AACAGGTTTT AATGACTCCG 
GAACAACTGA AGGCCGCTTT TCCATTGAGC CTGCAACAAG AAGCCCAGAT TGCTGACTCG 
CGTAAAACCA TTTCAGATAT TATCGCCGGG CGCGATCCTC GTCTGCTGGT AGTATGTGGT 
CCTTGTTCCA TTCATGATCC GGAAACTGCT CTGGAATATG CTCGTCGATT TAAAGCCCTT 
GCCGCAGAGG TCAGCGATAG CCTCTATCTG GTAATGCGCG TCTATTTTGA AAAACCCCGT 
ACCACTGTCG GCTGGAAAGG GTTAATTAAC GATCCCCATA TGGATGGCTC TTTTGATGTA 
GAAGCCGGGC TGCAGATCGC GCGTAAATTG CTGCTTGAGC TGGTGAATAT GGGACTGCCA 
CTGGCGACGG AAGCGTTAGA TCCGAATAGC CCGCAATACC TGGGCGATCT GTTTAGCTGG 
TCAGCAATTG GTGCTCGTAC AACGGAATCG CAAACTCACC GTGAAATGGC CTCCGGGCTT 
TCCATGCCGG TTGGTTTTAA AAACGGCACC GACGGCAGTC TGGCAACAGC AATTAACGCT 
ATGCGCGCCG CCGCCCAGCC GCACCGTTTT GTTGGCATTA ACCAGGCAGG GCAGGTTGCG 
TTGCTACAAA CTCAGGGGAA TCCGGACGGC CATGTGATCC TGCGCGGTGG TAAAGCGCCG 
AACTATAGCC CTGCGGATGT TGCGCAATGT GAAAAAGAGA TGGAACAGGC GGGACTGCGC 
CCGTCTCTGA TGGTAGATTG CAGCCACGGT AATTCCAATA AAGATTATCG CCGTCAGCCT 
GCGGTGGCAG AATCCGTGGT TGCTCAAATC AAAGATGGCA ATCGCTCAAT TATTGGTCTG 
ATGATCGAAA GTAATATCCA CGAGGGCAAT CAGTCTTCCG AGCAACCGCG CAGTGAAATG 
AAATACGGTG TATCCGTAAC CGATGCCTGC ATTAGCTGGG AAATGACCGA TGCCTTGCTG 
CGTGAAATTC ATCAGGATCT GAACGGGCAG CTGACGGCTC GCGTGGCTTA A

Protein sequence

MQKDALNNVH ITDEQVLMTP EQLKAAFPLS LQQEAQIADS RKTISDIIAG RDPRLLVVCG 
PCSIHDPETA LEYARRFKAL AAEVSDSLYL VMRVYFEKPR TTVGWKGLIN DPHMDGSFDV 
EAGLQIARKL LLELVNMGLP LATEALDPNS PQYLGDLFSW SAIGARTTES QTHREMASGL 
SMPVGFKNGT DGSLATAINA MRAAAQPHRF VGINQAGQVA LLQTQGNPDG HVILRGGKAP 
NYSPADVAQC EKEMEQAGLR PSLMVDCSHG NSNKDYRRQP AVAESVVAQI KDGNRSIIGL 
MIESNIHEGN QSSEQPRSEM KYGVSVTDAC ISWEMTDALL REIHQDLNGQ LTARVA