Gene ECH74115_3972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3972
Symbol	hycE
ID	6967056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3672891
End bp	3674621
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	56%
IMG OID	643387741
Product	formate hydrogenlyase, subunit E
Protein accession	YP_002272184
Protein GI	209400571
COG category	[C] Energy production and conversion
COG ID	[COG0852] NADH:ubiquinone oxidoreductase 27 kD subunit [COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTAAAG AGAGTTTGAG CATGTCTGAA GAAAAATTAG GTCAACATTA TCTCGCCGCG 
CTGAATGAGG CATTTCCGGG CGTCGTGCTG GACCACGCCT GGCAGACCAA AGATCAGCTG 
ACTGTCACCG TAAAGGTGAA CTATCTGCCG GAAGTGGTGG AGTTTCTCTA CTACAAGCAG 
GGGGGCTGGC TGTCGGTGCT TTTTGGTAAC GACGAACGCA AACTGAATGG TCATTACGCC 
GTTTACTACG TGCTGTCGAT GGAGAAGGGG ACTAAGTGCT GGGTAACGGT TCGCGTCGAA 
GTTGATGCCA ACAAACCGGA GTATCCTTCC GTGACGCCGC GCGTTCCGGC TGCGGTGTGG 
GGCGAGCGTG AAGTACGTGA TATGTACGGT TTGATTCCGG TTGGTTTGCC GGATGAACGT 
CGTCTGGTGC TGCCGGATGA CTGGCCGGAT GAACTTTATC CGCTGCGTAA AGACAGCATG 
GATTATCGTC AGCGTCCGGC ACCGACCACC GATGCTGAAA CCTACGAGTT CATCAACGAA 
CTGGGCGACA AGAAAAACAA CGTCGTGCCG ATTGGTCCGC TGCACGTCAC TTCTGACGAA 
CCGGGCCACT TCCGTCTGTT CGTCGATGGC GAAAACATTA TCGACGCCGA CTACCGCCTG 
TTCTATGTCC ATCGCGGCAT GGAAAAACTG GCAGAAACCC GCATGGGTTA TAACGAAGTG 
ACCTTCCTCT CTGACCGTGT GTGCGGGATC TGCGGTTTTG CTCACAGCAC CGCCTACACC 
ACGTCGGTGG AAAACGCGAT GGGTATTCAG GTGCCAGAAC GTGCGCAGAT GATCCGCGCC 
ATTCTGCTGG AGGTAGAACG TCTGCACTCG CATCTGCTCA ACCTCGGCCT CGCCTGTCAC 
TTTACCGGCT TTGACTCCGG CTTTATGCAG TTCTTCCGCG TGCGTGAAAC CTCCATGAAA 
ATGGCAGAGA TCCTTACCGG TGCGCGTAAA ACCTACGGCC TGAACCTGAT CGGCGGGATT 
CGTCGCGATC TGCTGAAAGA TGACATGATC CAGACCCGTC AACTGGCGCA ACAGATGCGT 
CGTGAAGTGC AGGAGCTGGT GGATGTGCTG CTGAGTACGC CGAACATGGA ACAGCGCACT 
GTCGGCATTG GTCGTCTGGA CCCGGAAATC GCTCGCGACT TCAGTAACGT CGGCCCGATG 
GTCCGTGCCA GCGGTCACGC CCGCGATACC CGCGCCGATC ACCCGTTTGT TGGTTATGGC 
CTGCTGCCAA TGGAAGTCCA CAGCGAGCAG GGCTGCGACG TTATTTCGCG TCTGAAAGTG 
CGTATTAACG AAGTCTATAC CGCGCTGAAC ATGATCGACT ACGGTCTGGA TAACCTGCCG 
GGCGGCCCGC TGATGGTGGA AGGCTTTACC TACATTCCGC ACCGTTTTGC GCTGGGCTTT 
GCCGAAGCGC CGCGCGGCGA TGATATCCAC TGGAGCATGA CCGGCGACAA CCAGAAGCTG 
TACCGCTGGC GCTGCCGTGC CGCGACCTAC GCGAACTGGC CGACCCTGCG CTACATGCTG 
CGCGGCAACA CCGTTTCTGA TGCGCCGCTG ATTATCGGTA GTCTGGACCC TTGCTACTCC 
TGTACCGACC GCATGACCGT GGTCGATGTG CGTAAGAAAA AGAGCAAAGT GGTGCCGTAC 
AAAGAACTCG AGCGTTACAG CATTGAGCGT AAAAACTCGC CGCTGAAATA A

Protein sequence

MIKESLSMSE EKLGQHYLAA LNEAFPGVVL DHAWQTKDQL TVTVKVNYLP EVVEFLYYKQ 
GGWLSVLFGN DERKLNGHYA VYYVLSMEKG TKCWVTVRVE VDANKPEYPS VTPRVPAAVW 
GEREVRDMYG LIPVGLPDER RLVLPDDWPD ELYPLRKDSM DYRQRPAPTT DAETYEFINE 
LGDKKNNVVP IGPLHVTSDE PGHFRLFVDG ENIIDADYRL FYVHRGMEKL AETRMGYNEV 
TFLSDRVCGI CGFAHSTAYT TSVENAMGIQ VPERAQMIRA ILLEVERLHS HLLNLGLACH 
FTGFDSGFMQ FFRVRETSMK MAEILTGARK TYGLNLIGGI RRDLLKDDMI QTRQLAQQMR 
REVQELVDVL LSTPNMEQRT VGIGRLDPEI ARDFSNVGPM VRASGHARDT RADHPFVGYG 
LLPMEVHSEQ GCDVISRLKV RINEVYTALN MIDYGLDNLP GGPLMVEGFT YIPHRFALGF 
AEAPRGDDIH WSMTGDNQKL YRWRCRAATY ANWPTLRYML RGNTVSDAPL IIGSLDPCYS 
CTDRMTVVDV RKKKSKVVPY KELERYSIER KNSPLK