Gene SeSA_A3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3001
Symbol	hycE
ID	6519866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	2901088
End bp	2902797
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	58%
IMG OID	642748025
Product	formate hydrogenlyase subunit E
Protein accession	YP_002115802
Protein GI	194737308
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit [COG3262] Ni,Fe-hydrogenase III component G
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.33609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.016492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAG AAAAATTAGG TCAACAATAC CTTGCGGCGC TGCACCAGGC GTTTCCGGGC 
GTCGTGCTGG ACGAAGCCTG GCAGACCAAA GATCAGCTGA CTATTACGGT AAAAGTGAAC 
TATCTGCCGG AAGTGGTGGA GTTTCTTTAC TACCAGCAGG GTGGGTGGCT GTCGGTGCTG 
TTCGGTAATG ACGAACGCCA GTTGTGCGGC CACTATGCCG TTTATTACGT GCTGTCGATG 
GAGCAGGGCA CGAAGTGCTG GATTACCGTC CGCGTTGAAG TGGATGCCAA TAAGCTGGAA 
TTCCCATCCG TTACGCCGCG CGTGCCGGCT GCCGTGTGGG GTGAGCGCGA AGTACGCGAC 
ATGTACGGTT TAATCCCGGT CGGTCTGCCG GACGAGCGCC GTCTGGTGCT GCCGGACGAC 
TGGCCGGACG AGCTGTATCC GCTACGTAAA GACAGCATGG ATTATCGTCA GCGCCCGGCG 
CCGACCACCG ATGCGGAAAC CTACGAGTTC ATTAACGAGC TGGGTGACAA GAAAAATAAC 
GTGGTGCCGA TTGGCCCGCT GCATGTCACT TCCGATGAGC CGGGCCACTT CCGTCTGTTC 
GTCGATGGCG AAAACATTAT CGACGCCGAC TACCGCCTGT TCTATGTCCA CCGCGGCATG 
GAAAAACTGG CGGAAACCCG TATGGGTTAT AACGAAGTGA CGTTCCTGTC GGATCGCGTG 
TGTGGTATCT GCGGCTTCGC GCACAGCACC GCCTACACCA CTTCCGTGGA AAACGCGATG 
GGCATTCAGG TGCCGGAACG TGCGCAAATG ATCCGCGCTA TTCTGCTGGA AGTGGAACGT 
CTGCACTCGC ATCTGCTCAA CCTCGGCCTG GCCTGCCACT TTACCGGCTT TGACTCCGGC 
TTTATGCAGT TCTTCCGCGT GCGTGAAACC TCCATGAAGA TGGCGGAAAT ACTGACCGGG 
GCGCGCAAAA CTTACGGTCT GAACCTGATC GGCGGGATTC GCCGCGATCT GCTGAAAGAA 
GACATGATCC AGACCCGTCA ACTGGCGCAG CAGATGCGTC GTGACGTGCA GGAGCTGGTG 
GACATGCTGC TGAGCACGCC GAATATGGAA CAGCGTACCG TGGGTATCGG CCGTCTGGAC 
CCGGAAATTG CCCGTGACTT CAGTAATGTC GGCCCGATGG TGCGCGCCAG CGGTCACGCC 
CGCGACACCC GCGCCGACCA CCCGTTTGTC GGTTACGGTC TGCTGCCGAT GGAAGTACAT 
AGCGAGCAGG GCTGCGATGT GATTTCTCGT CTGAAAGTCC GTATCAACGA AGTCTACACC 
TCGCTGAATA TGATCGATTT CGGTCTGGAT AATCTGCCGG GCGGCCCGCT GATGGTGGAA 
GGCTTTACCT ATATTCCGCA CCGTTTTGCG CTCGGCTTCG CTGAAGCGCC GCGTGGTGAC 
GATATCCACT GGAGCATGAC CGGCGACAAC CAGAAGCTGT ACCGCTGGCG CTGCCGTGCG 
GCGACCTACG CCAACTGGCC GACGCTGCGC TATATGCTGC GCGGCAACAC CGTCTCCGAC 
GCGCCGCTGA TTATCGGCAG CCTCGACCCG TGCTACTCCT GTACCGACCG GATGACCGTG 
GTCGATGTGC GTAAGAAGAA GAGCAAAGTC GTGCCGTACA AAGAACTTGA GCGCTACAGC 
ATTGAGCGTA AAAACTCGCC GCTGAAATAA

Protein sequence

MSEEKLGQQY LAALHQAFPG VVLDEAWQTK DQLTITVKVN YLPEVVEFLY YQQGGWLSVL 
FGNDERQLCG HYAVYYVLSM EQGTKCWITV RVEVDANKLE FPSVTPRVPA AVWGEREVRD 
MYGLIPVGLP DERRLVLPDD WPDELYPLRK DSMDYRQRPA PTTDAETYEF INELGDKKNN 
VVPIGPLHVT SDEPGHFRLF VDGENIIDAD YRLFYVHRGM EKLAETRMGY NEVTFLSDRV 
CGICGFAHST AYTTSVENAM GIQVPERAQM IRAILLEVER LHSHLLNLGL ACHFTGFDSG 
FMQFFRVRET SMKMAEILTG ARKTYGLNLI GGIRRDLLKE DMIQTRQLAQ QMRRDVQELV 
DMLLSTPNME QRTVGIGRLD PEIARDFSNV GPMVRASGHA RDTRADHPFV GYGLLPMEVH 
SEQGCDVISR LKVRINEVYT SLNMIDFGLD NLPGGPLMVE GFTYIPHRFA LGFAEAPRGD 
DIHWSMTGDN QKLYRWRCRA ATYANWPTLR YMLRGNTVSD APLIIGSLDP CYSCTDRMTV 
VDVRKKKSKV VPYKELERYS IERKNSPLK