Gene YpsIP31758_2363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2363
Symbol	hpaE
ID	5385655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2662424
End bp	2663890
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	53%
IMG OID	640865352
Product	5-carboxymethyl-2-hydroxymuconate semialdehyde dehydrogenase
Protein accession	YP_001401332
Protein GI	153950198
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR02299] 5-carboxymethyl-2-hydroxymuconate semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	0.702786
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCG TTAACCATTG GATTGATGGG AAAAATATTA CCAGTAAGGA CTATTTCACA 
ACAATCAACC CGGCCACTGG CGAGGTGCTG GCTGACGTGG CAAGCGGGGG GATAAAAGAG 
ATCAACCAAG CCGTTGCTGC CGCGAAAAGT GCTTTCCCTC ACTGGGCTAA CCTGCCGATG 
AAAGTGCGTG CCCGTCTAAT GCGCCGTCTG GGGGAGTTGA TTGAGCAACA GATCCCAGAA 
ATAGCGCAGA TGGAAACGCA GGATACCGGC CTGCCCATTT ATCAAACGCA AAATGCCTTG 
ATCCCGCGGG CAGCACATAA CTTCGAATTT TTTGCCGAAA TTTGTCAGCA AATGAATGGC 
CAGACGTATC CGGTTGACGA TCAAATGTTG AATTACACCT TGGTGCAACC CGTGGGAGTG 
TGTGCGTTGG TCTCCCCTTG GAATGTCCCT TTTATGACGG CGACCTGGAA GGTCGCGCCT 
TGTTTGGCGC TGGGTAACAC CGCGATATTG AAAATGTCGG AGCTATCGCC ACTGACCGCA 
GACAAACTGG GTGAACTGGC CTTAGAGGCG GGTATACCGG CGGGGGTTCT CAACGTGGTA 
CAAGGATATG GGGCCACTGT CGGTGATGCA TTGGTATGTC ATCAGGATGT CCGAGCTATC 
TCTTTTACCG GCGGCACCGC GACGGGAAAC CGCATCATGC AACGTGCCGG GTTGAAAAAA 
TACTCCATGG AACTCGGTGG TAAATCTCCG GTACTTATCT TCGACGATGC TGATATCGAA 
CGGGCTATGG ATGCGGCGCT ATTTTCCATC TTCTCTCTCA ATGGTGAACG TTGCACGGCG 
GGTTCGCGCA TTTTTATTCA AGAGAGTCTC TATTCGGCAT TTATTCAACG TTTTGCTGAG 
CGGGCCAGCC GTTTACGTGT GGGGGACCCA CAAGATCTCG ACACTCAAGT TGGCGCATTG 
ATCAATAAAC CGCATTGGGA CAAAGTTTCC GGCTATATCC AGTTGGGGAT AGAGGAGGGG 
GCCACGTTGT TGGCAGGGGG GCCGGATAAA CCCATCGACC TACCTGCTCA TCTGCGCGGA 
GGGCACTTCC TGCGTCCAAC GGTGTTGGCC GATGTTGATA ACCGAATGCG GGTTGCTCAG 
GAAGAGATTT TTGGACCGGT CGCTTGCCTG ATCCCCTTTA AGAATGAAGA CGCCGGACTG 
CGTTTGGCAA ACAGCGTGCC ATACGGTCTG GCTGCTTATA TCTGGACACA AGACGTCAGC 
AAAGTGCTGC GTTTGGCCCG AAGTATTGAA GCCGGCATGG TGTTCGTGAA TACCCAGAAT 
GTGCGGGATC TCCGCCAGCC ATTTGGCGGC ATCAAGGCAT CGGGAACCGG GCGCGAAGGG 
GGAAAGTACA GTTTTGATGT TTTTGCTGAA GTGAAAAACG TCTGTATTTC CATGGGGGAG 
CATCCGATCC CCCGTTGGGG GATGTAA

Protein sequence

MKIVNHWIDG KNITSKDYFT TINPATGEVL ADVASGGIKE INQAVAAAKS AFPHWANLPM 
KVRARLMRRL GELIEQQIPE IAQMETQDTG LPIYQTQNAL IPRAAHNFEF FAEICQQMNG 
QTYPVDDQML NYTLVQPVGV CALVSPWNVP FMTATWKVAP CLALGNTAIL KMSELSPLTA 
DKLGELALEA GIPAGVLNVV QGYGATVGDA LVCHQDVRAI SFTGGTATGN RIMQRAGLKK 
YSMELGGKSP VLIFDDADIE RAMDAALFSI FSLNGERCTA GSRIFIQESL YSAFIQRFAE 
RASRLRVGDP QDLDTQVGAL INKPHWDKVS GYIQLGIEEG ATLLAGGPDK PIDLPAHLRG 
GHFLRPTVLA DVDNRMRVAQ EEIFGPVACL IPFKNEDAGL RLANSVPYGL AAYIWTQDVS 
KVLRLARSIE AGMVFVNTQN VRDLRQPFGG IKASGTGREG GKYSFDVFAE VKNVCISMGE 
HPIPRWGM