Gene SeAg_B1826 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B1826
Symbol	aroH
ID	6792633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	1789539
End bp	1790585
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	642776056
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002146690
Protein GI	197251055
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGAA CCGACGAACT CCGTACTGCG CGTATCGACA GCCTGGTAAC ACCGACCGAA 
CTCGCGCAGC GGTATCCTGT ATCGTCCTCC GTCGCCAGTC ATGTTACCGA CTCCCGACGC 
CGGATAGAAA AGATTTTAAA TGGTGAAGAT CCACGGCTAC TGGTCGTCAT TGGCCCCTGT 
TCGATTCACG ATCTGAATGC TGCCATGGAA TACGCGACGC AGCTCCAGGC ACAACGCCAA 
AAGCATCAGG CGCGTCTGGA AATCGTCATG CGCACCTATT TTGAAAAACC GCGCACCGTC 
GTGGGATGGA AAGGCCTGAT TTCCGATCCT GACTTGAATG GAAGTTACCG CGTCAATTAT 
GGGCTTGAAC TGGCGCGTCG CTTGCTATTG CAGGTGAACG AACTGGGAGT ACCGACCGCC 
ACAGAGTTTC TTGATATGGT CACCGGCCAG TTTATTGCCG ATCTGATCAG TTGGGGAGCG 
ATTGGCGCGC GTACCACCGA AAGCCAAATC CATCGGGAAA TGGCTTCCGC GCTATCTTGT 
CCGGTCGGCT TTAAAAATGG TACGGATGGC AATACTCGCA TTGCCGTTGA CGCTATTCGC 
GCCTCCCGCG CCAGCCATAT GTTTCTCTCG CCGGATAAAG ACGGACAGAT GACTATCTAC 
CAGACGAGTG GCAACCCGTA TGGGCACATC ATCATGCGCG GCGGTAAAAA ACCGAACTAC 
CACGCTGAAG ATATTGCCGC CGCCTGCGAC ACGTTGCATG AATTTGATCT GCCGGAACAT 
CTGGTCGTCG ACTTCAGCCA CGGCAACTGT CAAAAACAGC ATCGCCGCCA GTTGGAGGTA 
TGTGATGATA TTTGCCAGCA GATTCGTAAT GGCTCCACGG CAATTGCCGG GATTATGGCC 
GAGAGTTTTT TACGGGAAGG CACGCAAAAA ATTATCAGCG GTCAACCATT AATCTATGGT 
CAGTCCATTA CCGATCCCTG CCTGAACTGG GAAGATACGG AAGTTCTGTT GGAAAAACTG 
GCCGCGGCGG TAGATAGCCG CTTTTAA

Protein sequence

MNRTDELRTA RIDSLVTPTE LAQRYPVSSS VASHVTDSRR RIEKILNGED PRLLVVIGPC 
SIHDLNAAME YATQLQAQRQ KHQARLEIVM RTYFEKPRTV VGWKGLISDP DLNGSYRVNY 
GLELARRLLL QVNELGVPTA TEFLDMVTGQ FIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAVDAIR ASRASHMFLS PDKDGQMTIY QTSGNPYGHI IMRGGKKPNY 
HAEDIAAACD TLHEFDLPEH LVVDFSHGNC QKQHRRQLEV CDDICQQIRN GSTAIAGIMA 
ESFLREGTQK IISGQPLIYG QSITDPCLNW EDTEVLLEKL AAAVDSRF