Gene SeD_A3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3159
Symbol	hycE
ID	6872837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3038284
End bp	3039993
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	58%
IMG OID	642786180
Product	formate hydrogenlyase, subunit E
Protein accession	YP_002216821
Protein GI	198245407
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit [COG3262] Ni,Fe-hydrogenase III component G
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.146854
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAG AAAAATTAGG TCAACAATAC CTTGCGGCGC TGCACCAGGC GTTTCCGGGC 
GTCGTGCTGG ACGAAGCCTG GCAGACCAAA GATCAGCTGA CTATTACGGT GAAAGTAAAC 
TATCTGCCGG AAGTGGTGGA GTTTCTTTAC TACCAGCAGG GTGGGTGGTT GTCGGTGCTG 
TTCGGTAATG ACGAACGCCA GTTGTGCGGC CACTATGCCG TTTATTACGT GCTGTCGATG 
GAGCAGGGCA CGAAGTGCTG GATTACCGTT CGCGTTGAAG TAGATGCCAA TAAGCTGGAA 
TTCCCATCCG TTACGCCGCG CGTGCCGGCT GCCGTGTGGG GTGAGCGCGA AGTACGCGAC 
ATGTACGGTT TAATCCCGGT CGGTCTGCCG GACGAGCGCC GTCTGGTGCT GCCGGACGAC 
TGGCCGGATG AACTCTATCC GCTGCGTAAA GACAGCATGG ATTATCGTCA GCGCCCGGCG 
CCGACCACCG ATGCGGAAAC CTACGAGTTC ATTAACGAGC TGGGTGACAA GAAAAATAAC 
GTGGTGCCGA TTGGCCCGCT GCATGTCACC TCCGATGAAC CGGGCCACTT CCGTCTGTTC 
GTCGATGGCG AAAACATTAT CGACGCCGAC TACCGCCTGT TCTACGTCCA CCGTGGTATG 
GAAAAACTGG CGGAAACCCG CATGGGTTAT AACGAAGTCA CCTTCCTGTC GGATCGCGTG 
TGTGGTATCT GCGGCTTCGC GCACAGCACT GCCTACACCA CTTCCGTGGA AAACGCGATG 
GGCATTCAGG TGCCGGAGCG TGCGCAGATG ATCCGCGCCA TTCTGCTGGA AGTGGAGCGT 
CTGCACTCGC ACCTGCTGAA CCTAGGCCTC GCCTGCCACT TTACCGGTTT TGACTCCGGC 
TTTATGCAGT TCTTCCGCGT GCGTGAAACC TCCATGAAAA TGGCAGAGAT CCTTACCGGC 
GCGCGCAAAA CTTACGGACT GAACCTGATC GGCGGGATTC GCCGCGATCT GCTCAAAGAG 
GACATGATCC AGACCCGTCA ACTGGCGCAG CAGATGCGTC GTGACGTGCA GGAGCTGGTG 
GACATGCTGC TGAGCACGCC GAATATGGAA CAGCGTACCG TGGGTATCGG CCGTCTGGAC 
CCGGAAATTG CCCGTGACTT CAGTAATGTC GGCCCGATGG TGCGCGCCAG CGGTCACGCC 
CGCGACACCC GCGCCGACCA CCCGTTTGTC GGCTACGGTC TGCTGCCGAT GGAAGTACAT 
AGCGAGCAGG GGTGCGACGT GATTTCTCGT CTGAAAGTCC GTATCAACGA AGTTTACACC 
TCGCTGAATA TGATCGATTT CGGTCTGGAT AATCTACCGG GCGGCCCGCT GATGGTGGAA 
GGCTTTACCT ATATTCCGCA CCGTTTTGCG CTCGGCTTCG CTGAAGCGCC GCGTGGTGAC 
GATATCCACT GGAGCATGAC CGGCGACAAC CAGAAGCTGT ACCGCTGGCG CTGCCGTGCG 
GCGACCTACG CCAACTGGCC GACGCTGCGC TATATGCTGC GCGGCAACAC CGTCTCCGAT 
GCGCCGCTGA TTATCGGCAG CCTCGACCCG TGCTACTCCT GTACCGACCG GATGACCGTG 
GTCGATGTGC GTAAGAAGAA GAGCAAAGTC GTGCCGTACA AAGAACTTGA GCGCTACAGC 
ATTGAGCGTA AAAACTCGCC GCTGAAATAA

Protein sequence

MSEEKLGQQY LAALHQAFPG VVLDEAWQTK DQLTITVKVN YLPEVVEFLY YQQGGWLSVL 
FGNDERQLCG HYAVYYVLSM EQGTKCWITV RVEVDANKLE FPSVTPRVPA AVWGEREVRD 
MYGLIPVGLP DERRLVLPDD WPDELYPLRK DSMDYRQRPA PTTDAETYEF INELGDKKNN 
VVPIGPLHVT SDEPGHFRLF VDGENIIDAD YRLFYVHRGM EKLAETRMGY NEVTFLSDRV 
CGICGFAHST AYTTSVENAM GIQVPERAQM IRAILLEVER LHSHLLNLGL ACHFTGFDSG 
FMQFFRVRET SMKMAEILTG ARKTYGLNLI GGIRRDLLKE DMIQTRQLAQ QMRRDVQELV 
DMLLSTPNME QRTVGIGRLD PEIARDFSNV GPMVRASGHA RDTRADHPFV GYGLLPMEVH 
SEQGCDVISR LKVRINEVYT SLNMIDFGLD NLPGGPLMVE GFTYIPHRFA LGFAEAPRGD 
DIHWSMTGDN QKLYRWRCRA ATYANWPTLR YMLRGNTVSD APLIIGSLDP CYSCTDRMTV 
VDVRKKKSKV VPYKELERYS IERKNSPLK