Gene EcHS_A3177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3177
Symbol	hyb0
ID	5593471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3189973
End bp	3191091
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	640922297
Product	hydrogenase 2 small subunit
Protein accession	YP_001459795
Protein GI	157162477
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGGAG ATAACACCCT CATCCATTCT CACGGCATTA ACCGTCGTGA TTTCATGAAG 
CTTTGTGCAG CATTAGCCGC CACCATGGGG TTAAGTAGCA AAGCCGCTGC AGAGATGGCC 
GAATCGGTTA CTAACCCGCA GCGTCCGCCA GTTATCTGGA TTGGCGCGCA GGAGTGCACC 
GGTTGTACGG AATCTCTGCT TCGTGCAACG CATCCAACGG TAGAAAACCT CGTACTGGAG 
ACTATCTCTC TGGAGTATCA CGAAGTGCTT TCCGCCGCCT TCGGTCATCA GGTCGAAGAG 
AACAAACATA ACGCTCTCGA GAAGTACAAA GGGCAGTATG TGTTAGTGGT GGATGGTTCC 
ATCCCATTAA AAGATAACGG TATTTATTGC ATGGTTGCCG GTGAGCCGAT TGTGGATCAC 
ATCCGCAAAG CGGCGGAAGG CGCAGCAGCC ATTATCGCTA TCGGTTCCTG CTCTGCGTGG 
GGCGGTGTTG CCGCAGCTGG AGTTAACCCA ACTGGCGCAG TCAGCCTGCA AGAAGTTCTG 
CCAGGCAAAA CCGTTATCAA TATTCCGGGC TGCCCGCCGA ACCCGCACAA CTTCCTCGCG 
ACCGTTGCGC ACATCATCAC TTACGGCAAA CCGCCGAAAC TGGATGACAA AAACCGTCCG 
ACCTTCGCCT ATGGCCGTCT GATTCACGAA CACTGCGAAC GTCGCCCGCA CTTCGATGCT 
GGTCGTTTTG CCAAAGAGTT CGGTGATGAA GGCCACCGCG AAGGCTGGTG CCTGTACCAC 
CTCGGCTGTA AAGGGCCAGA AACTTACGGC AACTGCTCAA CGCTGCAATT CTGCGATGTT 
GGCGGTGTGT GGCCGGTGGC GATTGGTCAC CCGTGCTATG GCTGTAACGA AGAAGGTATC 
GGCTTCCATA AAGGCATCCA TCAGCTTGCC AACGTCGAAA ATCAAACTCC GCGTTCACAG 
AAACCGGATG TTAACGCTAA AGAGGGCGGC AACGTCTCTG CAGGCGCTAT TGGTTTGCTC 
GGCGGTGTGG TTGGGTTGGT TGCCGGTGTC AGCGTGATGG CGGTGCGTGA ACTGGGTCGT 
CAGCAAAAGA AAGATAACGC TGACTCACGG GGAGAATAA

Protein sequence

MTGDNTLIHS HGINRRDFMK LCAALAATMG LSSKAAAEMA ESVTNPQRPP VIWIGAQECT 
GCTESLLRAT HPTVENLVLE TISLEYHEVL SAAFGHQVEE NKHNALEKYK GQYVLVVDGS 
IPLKDNGIYC MVAGEPIVDH IRKAAEGAAA IIAIGSCSAW GGVAAAGVNP TGAVSLQEVL 
PGKTVINIPG CPPNPHNFLA TVAHIITYGK PPKLDDKNRP TFAYGRLIHE HCERRPHFDA 
GRFAKEFGDE GHREGWCLYH LGCKGPETYG NCSTLQFCDV GGVWPVAIGH PCYGCNEEGI 
GFHKGIHQLA NVENQTPRSQ KPDVNAKEGG NVSAGAIGLL GGVVGLVAGV SVMAVRELGR 
QQKKDNADSR GE