Gene EcHS_A3174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3174
Symbol	hybC
ID	5593462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3186116
End bp	3187819
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	53%
IMG OID	640922294
Product	hydrogenase 2 large subunit
Protein accession	YP_001459792
Protein GI	157162474
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGA GAATTACTAT TGATCCGGTA ACCCGTATTG AGGGGCATTT ACGCATCGAT 
TGCGAAATCG AAAATGGCGT CGTTTCGAAA GCATGGGCTT CCGGTACCAT GTGGCGCGGC 
ATGGAAGAGA TCGTGAAAAA CCGCGATCCG CGCGATGCAT GGATGATTGT GCAACGTATC 
TGTGGCGTAT GTACTACCAC TCACGCGCTG TCTTCCGTTC GTGCGGCAGA AAGTGCGCTG 
AATATCGACG TTCCGGTTAA CGCGCAATAC ATCCGTAACA TCATTCTGGC TGCGCACACC 
ACGCATGACC ATATTGTTCA TTTCTATCAG CTTTCGGCGC TGGACTGGGT GGACATCACT 
TCTGCACTGC AAGCTGACCC AACCAAAGCC TCCGAAATGC TGAAAGGCGT TTCGACCTGG 
CACCTGAACA GTCCGGAAGA GTTCACCAAA GTTCAGAACA AGATCAAAGA TCTGGTTGCC 
AGCGGTCAGT TGGGTATTTT CGCTAATGGC TACTGGGGTC ATCCGGCGAT GAAACTGCCG 
CCGGAAGTGA ACCTGATTGC GGTAGCGCAC TACCTGCAAG CGTTGGAGTG CCAGCGTGAC 
GCTAACCGCG TCGTGGCGCT GCTGGGCGGT AAAACGCCGC ACATTCAGAA CCTGGCGGTA 
GGTGGTGTCG CGAACCCGAT CAACCTCGAC GGTTTGGGCG TGCTGAACCT TGAGCGCCTG 
ATGTACATCA AGTCTTTCAT CGACAAACTG AGCGACTTTG TTGAGCAGGT TTATAAGGTT 
GATACCGCAG TTATTGCCGC GTTCTACCCG GAATGGCTGA CACGCGGTAA AGGTGCGGTG 
AACTACCTGA GCGTGCCGGA ATTCCCGACC GACAGTAAAA ACGGCAGCTT CCTGTTCCCG 
GGCGGCTACA TTGAGAATGC GGATCTGTCC TCGTATCGTC CGATCACTTC TCATTCCGAT 
GAATACCTGA TCAAAGGCAT TCAGGAAAGC GCGAAGCACT CCTGGTATAA AGACGAAGCG 
CCGCAGGCAC CGTGGGAAGG CACCACCATT CCGGCTTATG ATGGTTGGTC TGACGACGGG 
AAATATTCCT GGGTGAAATC ACCGACTTTC TACGGCAAAA CGGTAGAAGT GGGGCCACTG 
GCTAATATGC TGGTGAAACT GGCGGCAGGT CGCGAATCTA CCCAGAACAA ACTGAATGAA 
ATCGTTGCGA TTTATCAGAA ACTGACTGGC AACACGCTGG AAGTGGCACA GCTGCACTCC 
ACGCTGGGCC GTATTATTGG TCGTACCGTT CACTGCTGTG AATTGCAGGA TATCCTGCAA 
AACCAATACA GTGCACTGAT CACCAATATC GGCAAAGGCG ATCACACCAC CTTTGTGAAG 
CCGAACATTC CGGCAACGGG TGAATTCAAA GGTGTTGGCT TCCTCGAAGC GCCGCGCGGT 
ATGCTCTCTC ACTGGATGGT TATTAAAGAC GGTATCATCA GCAACTACCA GGCGGTTGTT 
CCATCAACCT GGAACTCTGG TCCGCGTAAC TTCAATGATG ACGTCGGTCC TTACGAGCAG 
TCGCTGGTGG GTACACCGGT TGCCGATCCG AATAAACCGC TGGAAGTGGT GCGTACCATT 
CACTCCTTTG ACCCGTGCAT GGCCTGTGCG GTACACGTAG TGGATGCTGA CGGCAACGAA 
GTGGTTTCAG TGAAGGTTCT GTAA

Protein sequence

MSQRITIDPV TRIEGHLRID CEIENGVVSK AWASGTMWRG MEEIVKNRDP RDAWMIVQRI 
CGVCTTTHAL SSVRAAESAL NIDVPVNAQY IRNIILAAHT THDHIVHFYQ LSALDWVDIT 
SALQADPTKA SEMLKGVSTW HLNSPEEFTK VQNKIKDLVA SGQLGIFANG YWGHPAMKLP 
PEVNLIAVAH YLQALECQRD ANRVVALLGG KTPHIQNLAV GGVANPINLD GLGVLNLERL 
MYIKSFIDKL SDFVEQVYKV DTAVIAAFYP EWLTRGKGAV NYLSVPEFPT DSKNGSFLFP 
GGYIENADLS SYRPITSHSD EYLIKGIQES AKHSWYKDEA PQAPWEGTTI PAYDGWSDDG 
KYSWVKSPTF YGKTVEVGPL ANMLVKLAAG RESTQNKLNE IVAIYQKLTG NTLEVAQLHS 
TLGRIIGRTV HCCELQDILQ NQYSALITNI GKGDHTTFVK PNIPATGEFK GVGFLEAPRG 
MLSHWMVIKD GIISNYQAVV PSTWNSGPRN FNDDVGPYEQ SLVGTPVADP NKPLEVVRTI 
HSFDPCMACA VHVVDADGNE VVSVKVL