Gene ECH74115_4030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4030
Symbol
ID	6970371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3724002
End bp	3724787
Gene Length	786 bp
Protein Length	261 aa
Translation table	11
GC content	46%
IMG OID	643387793
Product	oxidoreductase, short chain dehydrogenase/reductase family
Protein accession	YP_002272236
Protein GI	209397522
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.721493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.432125
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATCG AATCTCTCAA TGCGTTCTCA ATGGATTTTT TCTCCCTGAA AGGTAAAACC 
GCAATTGTTA CCGGCGGGAA TAGCGGTTTA GGCCAGGCAT TTGCCATGGC GTTGGCCAAA 
GCAGGCGCAA ATGTCTTTAT TCCAAGTTTT GTCAAAGATA ACGGCGAAAC AAAGGAAATG 
ATTGAAAATC AGGGTGTTGA GGTGGACTTC ATGCAGGTGG ATATCACCGC AGAAGGCGCG 
CCGCAGAAGA TTATCGCTGC CTGCTGTGAG CGTTTCGGTA CAGTTGATAT TCTGGTTAAC 
AATGCCGGTA TTTGTAAGCT GAATAAGGTG CTGGACTTCG GTCGTGCCGA CTGGGACCCG 
ATGATTGATG TGAACCTGAC CGCCGCATTC GAGTTAAGCT ACGAAGCGGC AAAAATTATG 
ATCCCGCAGA AAAGCGGTAA AATCATTAAT ATCTGTTCAT TGTTCTCTTA CTTAGGTGGA 
CAATGGTCAC CTGCATATTC TGCTACTAAA CATGCTCTTG CCGGATTCAC CAAAGCTTAT 
TGTGATGAAC TAGGTCAATA TAATATTCAG GTAAATGGTA TCGCCCCTGG CTATTATGCA 
ACAGACATTA CGCTGGCGAC ACGCAGTAAT CCAGAAACCA ATCAGCGCGT TCTTGATCAT 
ATTCCGGCAA ACCGTTGGGG CGATACTCAG GATTTAATGG GCGCAGCCGT GTTTCTCGCA 
AGTCAGGCAT CGAATTATGT CAACGGGCAT TTATTAGTGG TCGATGGCGG TTATTTAGTG 
CGCTAA

Protein sequence

MSIESLNAFS MDFFSLKGKT AIVTGGNSGL GQAFAMALAK AGANVFIPSF VKDNGETKEM 
IENQGVEVDF MQVDITAEGA PQKIIAACCE RFGTVDILVN NAGICKLNKV LDFGRADWDP 
MIDVNLTAAF ELSYEAAKIM IPQKSGKIIN ICSLFSYLGG QWSPAYSATK HALAGFTKAY 
CDELGQYNIQ VNGIAPGYYA TDITLATRSN PETNQRVLDH IPANRWGDTQ DLMGAAVFLA 
SQASNYVNGH LLVVDGGYLV R