Gene EcSMS35_3283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3283
Symbol	hyb0
ID	6143950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3360468
End bp	3361586
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	641618113
Product	hydrogenase 2 small subunit
Protein accession	YP_001745263
Protein GI	170684089
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAG ATAACACCCT CATCCATTCT CACGGCATTA ACCGTCGTGA TTTCATGAAG 
CTTTGTGCAG CATTAGCCGC CACCATGGGG TTAAGTAGCA AAGCCGCTGC AGAGATGGCC 
GAATCGGTTA CTAACCCGCA GCGTCCGCCA GTTATCTGGA TTGGCGCGCA GGAGTGCACC 
GGTTGTACGG AATCTCTGCT TCGTGCAACG CATCCAACGG TAGAAAACCT CGTGCTGGAG 
ACTATCTCTC TGGAGTATCA CGAAGTGCTT TCCGCCGCCT TCGGTCATCA GGTCGAAGAG 
AACAAACATA ACGCACTTGA GAAGTACAAA GGGCAGTATG TGTTGGTTGT GGATGGTTCC 
ATCCCATTAA AAGATAACGG TATTTATTGC ATGGTTGCTG GTGAGCCGAT TGTGGATCAC 
ATCCGCAAAG CGGCAGAAGG CGCAGCAGCG ATTATCGCTA TCGGTTCCTG CTCTGCGTGG 
GGCGGTGTTG CCGCAGCTGG AGTTAACCCA ACTGGCGCAG TCAGCCTGCA AGAAGTTCTG 
CCAGGCAAAA CCGTTATCAA TATTCCGGGC TGCCCGCCGA ACCCGCACAA CTTCCTCGCG 
ACCGTTGCGC ACATCATCAC TTACGGCAAA CCGCCGAAAC TGGATGACAA AAATCGTCCG 
ACCTTCGCCT ATGGCCGTCT GATTCACGAA CACTGCGAAC GTCGCCCGCA CTTCGATGCT 
GGTCGTTTTG CCAAAGAGTT CGGTGATGAA GGCCACCGCG AAGGCTGGTG CCTGTACCAC 
CTCGGCTGTA AAGGGCCAGA AACTTACGGC AACTGCTCAA CGCTGCAATT CTGCGATGTT 
GGCGGTGTGT GGCCGGTGGC GATTGGTCAC CCGTGCTATG GCTGTAACGA AGAAGGTATC 
GGCTTCCATA AAGGCATCCA TCAGCTTGCC AACGTCGAAA ACCAGACTCC GCGTTCACAG 
AAACCGGATG TTAACGCTAA AGAAGGCGGC AACGTCTCGG CAGGCGCTAT TGGTTTGCTC 
GGCGGTGTGG TTGGGCTGGT TGCCGGTGTC AGCGTGATGG CGGTTCGTGA ACTGGGTCGT 
CAGCAAAAGA AAGATAACGC TGACTCACGG GGAGAATAA

Protein sequence

MTGDNTLIHS HGINRRDFMK LCAALAATMG LSSKAAAEMA ESVTNPQRPP VIWIGAQECT 
GCTESLLRAT HPTVENLVLE TISLEYHEVL SAAFGHQVEE NKHNALEKYK GQYVLVVDGS 
IPLKDNGIYC MVAGEPIVDH IRKAAEGAAA IIAIGSCSAW GGVAAAGVNP TGAVSLQEVL 
PGKTVINIPG CPPNPHNFLA TVAHIITYGK PPKLDDKNRP TFAYGRLIHE HCERRPHFDA 
GRFAKEFGDE GHREGWCLYH LGCKGPETYG NCSTLQFCDV GGVWPVAIGH PCYGCNEEGI 
GFHKGIHQLA NVENQTPRSQ KPDVNAKEGG NVSAGAIGLL GGVVGLVAGV SVMAVRELGR 
QQKKDNADSR GE