Gene ECH74115_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1030
Symbol
ID	6967936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1041320
End bp	1042750
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	54%
IMG OID	643385043
Product	NAD dependent epimerase/dehydratase family protein
Protein accession	YP_002269543
Protein GI	209395955
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCAAC GCATTTTAGT TCTTGGTGCC AGTGGCTACA TTGGTCAGCA TCTGGTGCGC 
ACACTCAGCC AGCAAGGGCA TCAGATCCTG GCGGCGGCAC GTCATGTCGA CAGGCTTGCA 
AAGCTGCAAC TGGCAAACGT CAGTTGCCAT AAAGTCGATC TCAGCTGGCC GGATAACCTT 
CCGGCCCTGT TACAGGATAT CGATACGGTC TATTTTCTGG TGCATAGCAT GGGCGAAGGC 
GGCGATTTTA TCGCTCAGGA GCGCCAGGTG GCTCTCAACT TCCGCGATGC GCTACGTGAA 
GTACCAGTTA AGCAATTAAT CTTTCTCAGT TCGTTGCAGG CCCCGCCACA TGAGCAGTCG 
GACCATCTGC GCGCGCGTCA GGCTACGGCG GACATTCTTC GTGAAGCGAA TGTACCAGTG 
ACCGAATTGC GTGCCGGAAT AATCGTTGGT GCAGGTTCAG CAGCGTTCGA AGTCATGCGC 
GATATGGTCT ACAACCTGCC AGTGTTAACG CCGCCACGCT GGGTACGTTC ACGCACCACG 
CCCATCGCGC TGGAAAACTT GCTGCACTAT CTGGTGGCGC TGTTAGACCA TCCAGCCAAC 
GAACACCGCA TCTTCGAAGC CGCCGGACCA GAGGTGCTCA GTTATCAGCA ACAGTTTGAA 
CATTTTATGG CGGTGAGCGG TAAGCGCCGC TGGTTGATCC CCATCCCCCT CCCCACCCGC 
TGGATTTCGG TGTGGTTTCT CAATGTGATT ACTTCCGTAC CGCCCACCAC CGCCAGGGCG 
TTGATTCAGG GGCTGAAACA CGATCTGCTG GCGGATGACA CCGCGCTACG TGCGCTCATC 
CCACAACGGC TGATCGCTTT CGATGACGCG GTACGTCGCA CCCTGAAAGA AGAAGAAAAG 
CTGGTCAACT CCAGCGACTG GGGATACGAC ACTCAGGCCT TTGCCCGCTG GCGACCAGAG 
TATGGTTATT TTGCCAAACA GGCGGGATTT ACCGTTAAAA CGTCCGCCAG CCTTGCGGCT 
TTATGGCAGG TGGTGAACCA AATCGGCGGT AAAGAGCGTT ATTTCTTTGG CAATATTTTG 
TGGCAGACAC GGGCGTTGAT GGACCGTGCG ATCGGTCATA AATTAGCGAA AGGCCGTCCG 
GAGCGCGAAT ATTTGCAAAC TGGCGATGCG GTGGATAGCT GGAAAGTGAT TGTCGTTGAA 
CCGGAAAAAC AACTTACGTT GTTATTTGGC ATGAAAGCAC CGGGGCTGGG ACGACTGTGT 
TTTACCCTGG AAGATAAAGG CGACTATCGT ACTATCGATG TCCGCGCTTT CTGGCATCCG 
CACGGTATGC CGGGGCTGTT TTACTGGTTA TTGATGATCC CCGCGCATCT GTTTATTTTT 
CGCGGAATGG CAAAACGAAT CGCCAGACTG GCAGAACAAA GCACAGATTA A

Protein sequence

MPQRILVLGA SGYIGQHLVR TLSQQGHQIL AAARHVDRLA KLQLANVSCH KVDLSWPDNL 
PALLQDIDTV YFLVHSMGEG GDFIAQERQV ALNFRDALRE VPVKQLIFLS SLQAPPHEQS 
DHLRARQATA DILREANVPV TELRAGIIVG AGSAAFEVMR DMVYNLPVLT PPRWVRSRTT 
PIALENLLHY LVALLDHPAN EHRIFEAAGP EVLSYQQQFE HFMAVSGKRR WLIPIPLPTR 
WISVWFLNVI TSVPPTTARA LIQGLKHDLL ADDTALRALI PQRLIAFDDA VRRTLKEEEK 
LVNSSDWGYD TQAFARWRPE YGYFAKQAGF TVKTSASLAA LWQVVNQIGG KERYFFGNIL 
WQTRALMDRA IGHKLAKGRP EREYLQTGDA VDSWKVIVVE PEKQLTLLFG MKAPGLGRLC 
FTLEDKGDYR TIDVRAFWHP HGMPGLFYWL LMIPAHLFIF RGMAKRIARL AEQSTD