Gene EcHS_A0808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0808
Symbol	aroG
ID	5592996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	812234
End bp	813286
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	52%
IMG OID	640919980
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001457547
Protein GI	157160229
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	0.147419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTATC AGAACGACGA TTTACGCATC AAAGAAATCA AAGAGTTACT TCCTCCTGTC 
GCATTGCTGG AAAAATTCCC CGCTACTGAA AATGCCGCGA ATACGGTTGC CCATGCCCGA 
AAAGCGATCC ATAAGATCCT GAAAGGTAAT GATGATCGCC TGTTGGTTGT GATTGGCCCA 
TGCTCAATTC ATGATCCTGT CGCGGCAAAA GAGTATGCCA CTCGCTTGCT GGCGCTGCGT 
GAAGAGCTGA AAGATGAGCT GGAAATCGTA ATGCGCGTCT ATTTTGAAAA GCCGCGTACC 
ACGGTGGGCT GGAAAGGGCT GATTAACGAT CCGCATATGG ATAATAGCTT CCAGATCAAC 
GACGGTCTGC GTATAGCCCG TAAATTGCTG CTTGATATTA ACGACAGCGG TCTGCCAGCG 
GCAGGTGAGT TTCTCGATAT GATCACCCCA CAATATCTCG CTGACCTGAT GAGCTGGGGC 
GCAATTGGCG CACGTACCAC CGAATCGCAG GTGCACCGCG AACTGGCATC AGGGCTTTCT 
TGTCCGGTCG GCTTCAAAAA TGGCACCGAC GGTACGATTA AAGTGGCTAT CGATGCCATT 
AATGCCGCCG GTGCGCCGCA CTGCTTCCTG TCCGTAACGA AATGGGGGCA TTCGGCGATT 
GTGAATACCA GCGGTAACGG CGATTGCCAT ATCATTCTGC GCGGCGGTAA AGAGCCTAAC 
TACAGCGCGA AGCACGTTGC TGAAGTGAAA GAAGGGCTGA ACAAAGCAGG CCTGCCAGCA 
CAGGTGATGA TCGATTTCAG CCATGCTAAC TCGTCCAAAC AATTCAAAAA GCAGATGGAT 
GTTTGTGCTG ACGTTTGCCA GCAGATTGCC GGTGGCGAAA AGGCCATTAT TGGCGTGATG 
GTGGAAAGCC ATCTGGTGGA AGGCAATCAG AGCCTCGAGA GCGGGGAGCC GCTGGCCTAC 
GGTAAGAGCA TCACCGATGC CTGCATCGGC TGGGAAGATA CCGATGCTCT GTTACGTCAA 
CTGGCGAATG CAGTAAAAGC GCGTCGCGGG TAA

Protein sequence

MNYQNDDLRI KEIKELLPPV ALLEKFPATE NAANTVAHAR KAIHKILKGN DDRLLVVIGP 
CSIHDPVAAK EYATRLLALR EELKDELEIV MRVYFEKPRT TVGWKGLIND PHMDNSFQIN 
DGLRIARKLL LDINDSGLPA AGEFLDMITP QYLADLMSWG AIGARTTESQ VHRELASGLS 
CPVGFKNGTD GTIKVAIDAI NAAGAPHCFL SVTKWGHSAI VNTSGNGDCH IILRGGKEPN 
YSAKHVAEVK EGLNKAGLPA QVMIDFSHAN SSKQFKKQMD VCADVCQQIA GGEKAIIGVM 
VESHLVEGNQ SLESGEPLAY GKSITDACIG WEDTDALLRQ LANAVKARRG