Gene SNSL254_A1458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1458
Symbol	aroH
ID	6482189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1424813
End bp	1425859
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	642736850
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002040604
Protein GI	194444464
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	0.958349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA CCGATGAACT CCGTACTGCG CGTATCGACA GCCTGGTAAC ACCGACCGAA 
CTCGCGCAGC GGTATCCTGT ATCGTCCTCC GTCGCCAGTC ACGTTACCGA CTCCCGACGC 
CGGATAGAAA AGATTTTAAA TGGTGAAGAT CCACGGCTAC TGGTCGTCAT TGGCCCCTGT 
TCGATTCACG ATCTGAATGC TGCCATGGAA TACGCGACGC AGCTCCAGGC ACAACGCCAA 
AAGCATCAGG CGCGTCTGGA AATCGTCATG CGCACCTATT TTGAAAAACC GCGCACCGTC 
GTGGGATGGA AAGGCCTGAT TTCCGATCCC GACTTGAATG GAAGTTACCG CGTCAATTAT 
GGGCTTGAAC TGGCGCGTCG CTTGCTATTG CAGGTGAACG AACTGGGAGT ACCGACCGCC 
ACAGAGTTTC TTGATATGGT CACTGGCCCG TTTATTGCCG ATCTGATCAG TTGGGGAGCG 
ATTGGCGCGC GTACCACCGA AAGCCAAATC CATCGGGAAA TGGCTTCTGC GCTCTCTTGT 
CCGGTCGGCT TTAAAAATGG TACAGATGGC AATACTCGCA TTGCCGTTGA CGCTATTCGC 
GCTTCCCGCG CCAGCCATAT GTTTCTCTCG CCGGATAAAG ACGGACAGAT GACCATCTAC 
CAGACGAGTG GCAACCCGTA TGGGCACATC ATCATGCGCG GCGGTAAAAA ACCGAACTAC 
CACGCTGAAG ATATTGCCGC CGCCTGCGAT ACGTTGCATG AATTTGATCT GCCGGAACAT 
CTGGTCGTCG ACTTCAGCCA CGGCAACTGT CAAAAACAGC ATCGCCGCCA GTTGGACGTA 
TGTGATGATA TTTGCCAGCA GATTCGTAAT GGCTCCACGG CAATTGCCGG GATTATGGCA 
GAGAGTTTTT TACGGGAAGG CACGCAAAAA ATTATCAGCG GTCAACCGTT AATCTATGGT 
CAATCCATTA CCGATCCCTG CCTGAACTGG GAAGATACGG AAGTTCTGTT GGAAAAACTT 
GCCGCGGCGG TAGACAGCCG CTTTTAA

Protein sequence

MNRTDELRTA RIDSLVTPTE LAQRYPVSSS VASHVTDSRR RIEKILNGED PRLLVVIGPC 
SIHDLNAAME YATQLQAQRQ KHQARLEIVM RTYFEKPRTV VGWKGLISDP DLNGSYRVNY 
GLELARRLLL QVNELGVPTA TEFLDMVTGP FIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAVDAIR ASRASHMFLS PDKDGQMTIY QTSGNPYGHI IMRGGKKPNY 
HAEDIAAACD TLHEFDLPEH LVVDFSHGNC QKQHRRQLDV CDDICQQIRN GSTAIAGIMA 
ESFLREGTQK IISGQPLIYG QSITDPCLNW EDTEVLLEKL AAAVDSRF