Gene SeHA_C1476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1476
Symbol	aroH
ID	6490840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1430441
End bp	1431487
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	642741706
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002045353
Protein GI	194447860
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	0.774591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA CCGACGAACT CCGTACTGCG CGTATCGACA GCCTGGTAAC ACCGACCGAA 
CTCGCGCAGC GGTATCCTGT ATCGTCCTCC GTCGCCAGTC ACGTTACCGA CTCCCGACGC 
CGGATAGAAA AGATTTTAAA TGGTGAAGAT CCACGGCTAC TGGTCGTCAT TGGCCCCTGT 
TCGATTCACG ATCTGAATGC TGCCATGGAA TACGCGACGC AGCTCCAGGC ACAACGCCAA 
AAGCATCAGG CGCGTCTGGA AATCGTCATG CGCACCTATT TTGAAAAACC GCGCACCGTC 
GTGGGATGGA AAGGCCTGAT TTCCGATCCC GACTTGAATG GCAGTTACCG CGTCAATTAT 
GGGCTTGAAC TGGCGCGTCG CTTGCTATTG CAGGTGAACG AACTGGGAGT ACCGACCGCC 
ACAGAGTTTC TTGATATGGT CACCGGCCAG TTTATTGCCG ATCTGATCAG TTGGGGAGCG 
ATTGGCGCGC GTACCACCGA AAGCCAAATC CATCGGGAAA TGGCTTCTGC GCTCTCTTGT 
CCGGTCGGCT TTAAAAATGG TACGGATGGC AATACCCGCA TTGCCGTTGA TGCTATTCGC 
GCCTCCCGCG CCAGTCATAT GTTTCTCTCG CCGGATAAAG ACGGACAGAT GACTATCTAC 
CAAACGAGTG GCAACCCGTA TGGGCACATC ATCATGCGCG GCGGTAAAAA ACCGAACTAC 
CACGCTGAAG ATATTGCCGC CGCCTGCGAC ACGTTGCATG AATTTGATCT GCCGGAACAT 
CTGGTCGTCG ACTTCAGCCA CGGCAACTGT CAAAAACAGC ATCGCCGCCA GCTGGAGGTA 
TGTGATGATA TTTGCCAGCA GATTCGTAAT GGCTCCACGG CAATTGCCGG GATTATGGCC 
GAGAGTTTTT TACGGGAAGG CACGCAAAAA ATTATCAGCG GTCAACCATT AATCTATGGT 
CAGTCCATTA CCGATCCCTG CCTGAACTGG GAAGATACGG AAGTTTTGTT GGAAAAACTT 
GCCGCAGCGG TAGACAGCCG CTTTTAA

Protein sequence

MNRTDELRTA RIDSLVTPTE LAQRYPVSSS VASHVTDSRR RIEKILNGED PRLLVVIGPC 
SIHDLNAAME YATQLQAQRQ KHQARLEIVM RTYFEKPRTV VGWKGLISDP DLNGSYRVNY 
GLELARRLLL QVNELGVPTA TEFLDMVTGQ FIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAVDAIR ASRASHMFLS PDKDGQMTIY QTSGNPYGHI IMRGGKKPNY 
HAEDIAAACD TLHEFDLPEH LVVDFSHGNC QKQHRRQLEV CDDICQQIRN GSTAIAGIMA 
ESFLREGTQK IISGQPLIYG QSITDPCLNW EDTEVLLEKL AAAVDSRF