Gene ECH74115_4306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4306
Symbol	hybC
ID	6968235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3984722
End bp	3986425
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	53%
IMG OID	643388035
Product	hydrogenase 2 large subunit
Protein accession	YP_002272473
Protein GI	209397380
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.228665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA GAATTACTAT TGATCCGGTA ACCCGTATTG AGGGGCATTT ACGCATCGAT 
TGCGAAATCG AAAATGGCGT CGTTTCGAAA GCATGGGCTT CCGGTACCAT GTGGCGCGGC 
ATGGAAGAGA TCGTGAAAAA CCGCGATCCG CGCGATGCAT GGATGATTGT GCAACGTATC 
TGTGGCGTAT GTACTACCAC TCACGCGCTG TCTTCCGTTC GTGCGGCAGA AAGTGCGCTG 
AATATCGACG TTCCGGTTAA CGCGCAATAC ATCCGTAACA TCATTCTGGC TGCGCACACC 
ACGCATGACC ATATCGTTCA TTTCTATCAG CTTTCGGCGC TGGACTGGGT GGACATCACT 
TCTGCACTGC AAGCTGACCC AACCAAAGCC TCCGAAATGC TGAAAGGTGT TTCGACCTGG 
CACCTGAACA GTCCGGAAGA GTTCACCAAA GTTCAGAACA AGATCAAAGA TCTGGTTGCC 
AGCGGTCAGT TGGGTATTTT CGCCAATGGC TACTGGGGTC ACCCGGCGAT GAAACTGCCG 
CCGGAAGTGA ACCTGATTGC GGTAGCGCAC TACCTGCAGG CGCTGGAGTG CCAGCGTGAC 
GCTAACCGCG TCGTGGCGCT GCTGGGCGGT AAAACGCCGC ACATTCAGAA CCTGGCGGTA 
GGTGGGGTCG CTAACCCAAT CAACCTCGAC GGTCTGGGCG TGCTGAACCT TGAGCGCCTG 
ATGTACATCA AGTCTTTCAT CGACAAGCTG AGTGACTTTG TTGAGCAGGT TTACAAGGTC 
GATACTGCGG TTATCGCTGC GTTCTACCCG GAATGGCTGA CGCGCGGTAA AGGTGCGGTG 
AACTACCTGA GCGTGCCGGA ATTCCCGACC GACAGTAAAA ACGGCAGCTT CCTGTTCCCG 
GGCGGCTACA TTGAGAATGC GGATCTGTCC TCGTATCGTC CGATCACTTC TCATTCCGAT 
GAATACCTGA TCAAAGGCAT TCAGGAAAGC GCGAAGCACT CCTGGTATAA AGACGAAGCG 
CCGCAGGCAC CGTGGGAAGG TACCACCATT CCGGCTTATG ATGGTTGGTC TGACGACGGG 
AAATATTCCT GGGTGAAATC ACCGACTTTC TACGGCAAAA CGGTAGAAGT GGGTCCGCTG 
GCTAATATGC TGGTGAAACT GGCGGCAGGT CGCGAATCTA CCCAGAACAA ACTGAATGAA 
ATCGTTGCGA TTTATCAGAA ACTGACTGGC AACACGCTGG AAGTGGCACA GCTGCACTCC 
ACGCTGGGCC GTATTATTGG TCGTACCGTT CACTGCTGTG AATTGCAGGA TATCCTGCAA 
AACCAATACA GTGCACTGAT CACCAATATC GGCAAAGGCG ATCACACCAC CTTTGTGAAG 
CCGAACATTC CGGCAACGGG TGAGTTCAAA GGTGTTGGCT TCCTCGAAGC GCCGCGCGGT 
ATGCTCTCTC ACTGGATGGT GATCAAAGAC GGTATCATCA GCAACTACCA GGCAGTTGTT 
CCATCAACCT GGAACTCTGG CCCGCGTAAC TTCAATGATG ACGTCGGTCC TTACGAGCAG 
TCGCTGGTGG GTACACCGGT TGCTGATCCG AATAAACCGC TGGAAGTGGT GCGTACCATT 
CACTCCTTCG ACCCGTGCAT GGCCTGTGCG GTACACGTAG TGGATGCTGA CGGCAACGAA 
GTGGTTTCAG TGAAGGTTCT GTAA

Protein sequence

MSQRITIDPV TRIEGHLRID CEIENGVVSK AWASGTMWRG MEEIVKNRDP RDAWMIVQRI 
CGVCTTTHAL SSVRAAESAL NIDVPVNAQY IRNIILAAHT THDHIVHFYQ LSALDWVDIT 
SALQADPTKA SEMLKGVSTW HLNSPEEFTK VQNKIKDLVA SGQLGIFANG YWGHPAMKLP 
PEVNLIAVAH YLQALECQRD ANRVVALLGG KTPHIQNLAV GGVANPINLD GLGVLNLERL 
MYIKSFIDKL SDFVEQVYKV DTAVIAAFYP EWLTRGKGAV NYLSVPEFPT DSKNGSFLFP 
GGYIENADLS SYRPITSHSD EYLIKGIQES AKHSWYKDEA PQAPWEGTTI PAYDGWSDDG 
KYSWVKSPTF YGKTVEVGPL ANMLVKLAAG RESTQNKLNE IVAIYQKLTG NTLEVAQLHS 
TLGRIIGRTV HCCELQDILQ NQYSALITNI GKGDHTTFVK PNIPATGEFK GVGFLEAPRG 
MLSHWMVIKD GIISNYQAVV PSTWNSGPRN FNDDVGPYEQ SLVGTPVADP NKPLEVVRTI 
HSFDPCMACA VHVVDADGNE VVSVKVL