Gene ECH74115_0695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0695
Symbol
ID	6970855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	726717
End bp	727955
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	50%
IMG OID	643384730
Product	oxidoreductase, zinc-binding dehydrogenase family
Protein accession	YP_002269243
Protein GI	209396266
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAT TGACTTATCA CGGCCCACAT CACGTTCAGG TAGAAAATGT TCCCGATCCG 
GGCATTGAAC AGGCAGATGA TATTATTCTG CGTATAACGG CAACGGCGAT CTGTGGCTCT 
GACCTCCATC TTTATCGAGG CAAAATACCC CAGGTTAAAC ATGGCGATAT TTTTGGTCAT 
GAATTTATGG GGGAAGTAGT TGAAACCGGA AAGGATGTAA AAAATTTGCA AAAAGGCGAC 
CGGGTGGTAA TTCCGTTCGT CATTGCTTGT GGCGACTGTT TTTTCTGTCG ACTGCAGCAA 
TATGCTGCCT GCGAAAATAC CAATGCGGGT AAAGGCGCTG CGCTCAATAA AAAACAGATA 
CCAGCTCCCG CGGCATTGTT TGGTTATAGT CACCTGTATG GTGGCGTTCC TGGTGGACAG 
GCGGAGTATG TCCGTGTCCC TAAAGGGAAT GTGGGGCCGT TTAAAGTACC GCCTTTGCTT 
TCAGATGATA AAGCCCTTTT CCTTTCTGAT ATTCTGCCAA CGGCATGGCA GGCAGCAAAA 
AATGCGCAGA TCCAACAAGG TTCAAGCGTT GCTGTCTATG GTGCCGGTCC TGTGGGATTG 
TTGACAATCG CCTGTGCACG GTTGCTCGGT GCGGAACAGA TTTTTGTTGT TGATCATCAT 
CCCTACCGCT TGCGTTTCGC CGCTGACCGC TACGGCGCGA TCCCGATTAA TTTCGATGAA 
GATAGCGATC CGGCACAGTC AATTATTGAA CAAACGGCAG GTCACCGGGG CGTGGATGCA 
GTAATAGACG CCGTCGGTTT TGAAGCGAAA GGCAGCACCA CGGAAACGGT GCTGACTAAC 
CTGAAACTGG AGGGCAGCAG CGGTAAAGCG TTGCGTCAGT GTATTGCGGC GGTCAGGCGT 
GGCGGCATTG TTAGCGTACC GGGCGTCTAC GCTGGATTTA TTCACGGTTT CCTGTTTGGC 
GACGCCTTTG ATAAAGGGTT GACGTTTAAA ATGGGACAGA CCCACGTTCA CGCATGGCTG 
GGAGAATTAT TACCGTTAAT TGAGAAAGGA TTACTGAAAC CAGAAGAAAT TGTTACCCAC 
TATATGCCGT TTGAAGAGGC CGCCCGGGGA TATGAGATCT TTGAAAAGCG TGAAGAGGAG 
TGCCGTAAGG TGATTCTGGT ACCCGGTGCA CAAAGCGCAG AGGCGGCGCA GAAGGCGGTT 
TCAGGTCTGG TGAATGCGAT GCCGGGGGGA ACAATATGA

Protein sequence

MKALTYHGPH HVQVENVPDP GIEQADDIIL RITATAICGS DLHLYRGKIP QVKHGDIFGH 
EFMGEVVETG KDVKNLQKGD RVVIPFVIAC GDCFFCRLQQ YAACENTNAG KGAALNKKQI 
PAPAALFGYS HLYGGVPGGQ AEYVRVPKGN VGPFKVPPLL SDDKALFLSD ILPTAWQAAK 
NAQIQQGSSV AVYGAGPVGL LTIACARLLG AEQIFVVDHH PYRLRFAADR YGAIPINFDE 
DSDPAQSIIE QTAGHRGVDA VIDAVGFEAK GSTTETVLTN LKLEGSSGKA LRQCIAAVRR 
GGIVSVPGVY AGFIHGFLFG DAFDKGLTFK MGQTHVHAWL GELLPLIEKG LLKPEEIVTH 
YMPFEEAARG YEIFEKREEE CRKVILVPGA QSAEAAQKAV SGLVNAMPGG TI