Gene ECH74115_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2021
Symbol	aldA
ID	6966843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1920330
End bp	1921769
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	51%
IMG OID	643385938
Product	aldehyde dehydrogenase A
Protein accession	YP_002270427
Protein GI	209396361
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0000217871
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAGTAC CCGTTCAACA TCCTATGTAT ATTGATGGAC AGTTTGTTAC CTGGCGTGGA 
GACGCATGGA TTGATGTGGT AAACCCTGCT ACAGAGGCTG TCATTTCCCG CATTCCCGAT 
GGTCAGGCCG AGGATGCCCG TAAGGCAATC GATGCAGCAG AACGTGCACA ACCAGAATGG 
GAAGCGTTGC CTGCAATTGA ACGCGCCAGT TGGTTGCGCA AAATCTCCGC CGGGATCCGC 
GAACGCGCCA GTGAAATCAG TGCGCTGATT GTTGAAGAAG GGGGCAAGAT CCAGCAGCTG 
GCTGAAGTCG AAGTGGCTTT TACTGCCGAC TATATCGATT ACATGGCGGA GTGGGCACGG 
CGTTACGAGG GCGAGATTAT TCAAAGCGAT CGTCCAGGAG AAAATATTCT TCTGTTTAAA 
CGTGCGCTTG GTGTGACTAC CGGCATTCTG CCGTGGAACT TCCCGTTCTT CCTCATTGCC 
CGCAAAATGG CTCCCGCTCT TTTGACTGGT AATACCATTG TCATTAAACC CAGTGAATTT 
ACGCCAAACA ATGCGATTGC ATTCGCCAAA ATCGTCGATG AAATAGGCCT TCCGCGCGGC 
GTGTTTAACC TTGTTCTGGG GCGTGGTGAA ACCGTTGGGC AAGAACTGGC GGGTAACCCA 
AAGGTCGCAA TGGTCAGTAT GACAGGCAGC GTCTCTGCAG GTGAGAAGAT CATGGCGACT 
GCGGCGAAAA ACATCACCAA AGTGTGCCTG GAACTGGGGG GTAAAGCACC AGCTATCGTA 
ATGGACGATG CCGATCTTGA ACTGGCAGTC AAAGCCATCG TTGATTCACG CGTCATTAAT 
AGTGGGCAAG TGTGTAACTG TGCAGAACGT GTTTATGTAC AGAAAGGCAT TTATGATCAG 
TTCGTCAATC GGCTGGGTGA AGCGATGCAG GCGGTTCAAT TTGGTAACCC CGCTGAACGC 
AACGACATTG CGATGGGGCC GTTGATTAAC GCCGCGGCGC TGGAAAGGGT CGAGCAAAAA 
GTGGCGCGCG CAGTAGAAGA AGGGGCGAGA GTGGCGTTGG GTGGCAAAGC GGTAGAGGGG 
AAAGGATATT ATTATCCGCC GACATTGCTG CTGGATGTTC GCCAGGAAAT GTCGATTATG 
CATGAGGAAA CCTTTGGCCC GGTTCTGCCG GTAGTCGCAT TTGACACGCT GGAAGATGCT 
ATCTCAATGG CTAATGACAG TGATTACGGC CTGACCTCAT CAATCTATAC CCAAAATCTG 
AACGTCGCGA TGAAAGCCAT TAAAGGGCTG AAGTTTGGTG AAACTTACAT CAACCGTGAA 
AACTTCGAAG CTATGCAAGG CTTCCACGCC GGATGGCGTA AATCCGGTAT TGGCGGCGCA 
GATGGTAAAC ATGGCCTGCA TGAATATCTG CAGACCCAGG TGGTTTATTT ACAGTCTTAA

Protein sequence

MSVPVQHPMY IDGQFVTWRG DAWIDVVNPA TEAVISRIPD GQAEDARKAI DAAERAQPEW 
EALPAIERAS WLRKISAGIR ERASEISALI VEEGGKIQQL AEVEVAFTAD YIDYMAEWAR 
RYEGEIIQSD RPGENILLFK RALGVTTGIL PWNFPFFLIA RKMAPALLTG NTIVIKPSEF 
TPNNAIAFAK IVDEIGLPRG VFNLVLGRGE TVGQELAGNP KVAMVSMTGS VSAGEKIMAT 
AAKNITKVCL ELGGKAPAIV MDDADLELAV KAIVDSRVIN SGQVCNCAER VYVQKGIYDQ 
FVNRLGEAMQ AVQFGNPAER NDIAMGPLIN AAALERVEQK VARAVEEGAR VALGGKAVEG 
KGYYYPPTLL LDVRQEMSIM HEETFGPVLP VVAFDTLEDA ISMANDSDYG LTSSIYTQNL 
NVAMKAIKGL KFGETYINRE NFEAMQGFHA GWRKSGIGGA DGKHGLHEYL QTQVVYLQS