Gene ECH74115_0502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0502
Symbol
ID	6967954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	506925
End bp	507899
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	54%
IMG OID	643384550
Product	oxidoreductase, aldo/keto reductase family
Protein accession	YP_002269064
Protein GI	209399102
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATACA ACCCCTTAGG AAAAACCGAC CTTCGCGTTT CCCGACTTTG CCTCGGCTGT 
ATGACCTTTG GCGAGCCAGA TCGTGGTAAT CACGCATGGA CACTGCCGGA AGAGAGCAGC 
CGTCCCATCA TTAAACGCGC ACTGGAAGGC GGCATAAATT TCTTTGATAC CGCCAATAGC 
TATTCCGATG GCAGCAGCGA AGAGATCGTC GGTCGCGCAC TGCGGGATTT CTCCCGTCGT 
GAAGACGTGG TCGTTGCCAC CAAAGTGTTC CATCGCGTTG GTGATTTACC GGAAGGATTA 
TCCCGTGCAC AAATTTTGCG CTCTATCGAC GACAGCCTGC GACGTCTCGG CATGGATTAT 
GTCGATATCC TGCAAATTCA TCGCTGGGAT TACAACACGC CGATCGAAGA GACGCTGGAA 
GCCCTCAACG ACGTGGTAAA AGCCGGGAAA GCGCGTTATA TCGGCGCGTC ATCCATGCAC 
GCTTCGCAGT TTGCTCAGGC ACTGGAACTA CAAAAACAGC ACGGCTGGGC GCAGTTTGTC 
AGTATGCAGG ATCACTACAA TCTGATTTAT CGCGAAGAAG AGCGCGAGAT GCTGCCGCTG 
TGTTATCAGG AAGGCGTGGC GGTCATTCCG TGGAGTCCGC TGGCGCGGGG GCGACTGACG 
CGTCCGTGGG GAGAAACTAC CGCACGACTG GTGTCTGATG AGGTGGGGAA AAATCTCTAT 
AAAGAAAGCG ATGAAAATGA CGCGCAGATC GCAGAGCGGT TAACGGGCGT CAGTGAAGAA 
CTCGGTGCAA CACGAGCACA AGTTGCGCTG GCCTGGTTGT TGAGTAAACC GGGCATTGCC 
GCACCGATTA TCGGAACTTC GCGGGAAGAA CAGCTTGATG AGCTGCTGAA CGCGGTGGAT 
ATCACTTTGA AGCCGGAACA GATTGCTGAA CTGGAAACAC CGTATAAACC GCATCCGGTC 
GTAGGATTTA AGTAA

Protein sequence

MQYNPLGKTD LRVSRLCLGC MTFGEPDRGN HAWTLPEESS RPIIKRALEG GINFFDTANS 
YSDGSSEEIV GRALRDFSRR EDVVVATKVF HRVGDLPEGL SRAQILRSID DSLRRLGMDY 
VDILQIHRWD YNTPIEETLE ALNDVVKAGK ARYIGASSMH ASQFAQALEL QKQHGWAQFV 
SMQDHYNLIY REEEREMLPL CYQEGVAVIP WSPLARGRLT RPWGETTARL VSDEVGKNLY 
KESDENDAQI AERLTGVSEE LGATRAQVAL AWLLSKPGIA APIIGTSREE QLDELLNAVD 
ITLKPEQIAE LETPYKPHPV VGFK