Gene ECH74115_1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1411
Symbol
ID	6972412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1400612
End bp	1401550
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	51%
IMG OID	643385385
Product	D-isomer specific 2-hydroxyacid dehydrogenase family protein
Protein accession	YP_002269879
Protein GI	209399765
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.160702
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCA TCTTTTATCA CCCAACGTTC GATACCCAAT GGTGGATAGA GGCACTGCGC 
AAAGCTATTC CTCAGGCAAG AGTCAGAGCA TGGAAAAGCG GAGATAATGA CTCTGCTGAT 
TATGCTTTAG CCTGGCATCC TCCTGTTGAA ATGCTGGCAG GGCGCGATCT TAAAGCGGTG 
TTCGCACTCG GGGCCGGTGT TGATTCTATT TTGAGCAAGC TACAGGCACA CCCTGAAATG 
CTGAAGCCTT CTGTTCCACT TTTTCGCCTG GAAGATACCG GTATGGGCGA GCAAATGCAG 
GAATATGCTG TCAGTCAGGT GCTGCATTGG TTTCGACGTT TTGACGATTA TCGCATCCAG 
CAAAATAGTT CGCATTGGCA ACCGCTGCCT GAATATCATC GGGAAGATTT TACCATCGGC 
ATTTTGGGCG CAGGCGTACT GGGCAGTAAA GTTGCTCAGA GTCTGCAAAC CTGGCGCTTT 
CCGCTGCGTT GCTGGAGTCG AACCCGTAAA TCGTGGCCTG GCGTGCAAAG CTTTGCCGGA 
TGGGAAGAAC TGTCTGCATT TCTGAGCCAA TGTCGGGTAT TGATTAATTT GTTACCGAAT 
ACCCCTGAAA CCGTCGGCAT TATTAATCAA CAATTACTCG AAAAATTACC GGATGGCGCG 
TATCTCCTCA ACCTGGCGCG TGGTGTTCAT GTCGTGGAAG ATGACCTGCT CGCGGCGCTG 
GATAGCGGCA AAGTTAAAGG CGCAATGTTG GATGTTTTTA ATCGTGAACC CTTACCGCCT 
GAAAGTCCGC TCTGGCAACA TCCACGCGTG ACGATAACAC CACATGTCGC CGCGATTACC 
CGTCCCGCTG AAGCTGTGGA GTACATTTCT CGCACTATTG CCCAGCTCGA AAAAGGGGAG 
AGGGTCTGCG GGCAAGTCGA CCGCGCACGC GGCTACTAA

Protein sequence

MDIIFYHPTF DTQWWIEALR KAIPQARVRA WKSGDNDSAD YALAWHPPVE MLAGRDLKAV 
FALGAGVDSI LSKLQAHPEM LKPSVPLFRL EDTGMGEQMQ EYAVSQVLHW FRRFDDYRIQ 
QNSSHWQPLP EYHREDFTIG ILGAGVLGSK VAQSLQTWRF PLRCWSRTRK SWPGVQSFAG 
WEELSAFLSQ CRVLINLLPN TPETVGIINQ QLLEKLPDGA YLLNLARGVH VVEDDLLAAL 
DSGKVKGAML DVFNREPLPP ESPLWQHPRV TITPHVAAIT RPAEAVEYIS RTIAQLEKGE 
RVCGQVDRAR GY