Gene SbBS512_E3424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3424
Symbol	hyb0
ID	6272642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3187034
End bp	3188152
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	641727311
Product	hydrogenase 2 small subunit
Protein accession	YP_001881760
Protein GI	187731765
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGGAG ATAACACCCT CATCCATTCT CACGGCATTA ACCGTCGTGA TTTCATGAAG 
CTTTGTGCAG CATTAGCCGC CACCATGGGG TTAAGTAGCA AAGCCGCTGC AGAGATGGCC 
GAATCGGTTA CTAACCCGCA GCGTCCGCCA GTTATCTGGA TTGGCGCGCA GGAGTGCACC 
GGTTGTACGG AATCTCTGCT TCGTGCAACG CATCCAACGG TAGAAAACCT CGTGCTGGAG 
ACTATCTCTC TGGAGTATCA CGAAGTGCTT TCCGCCGCCT TCGGTCATCA GGTCGAAGAG 
AACAAACATA ACGCACTTGA GAAGTACAAA GGGCAGTATG TGTTGGTTGT GGATGGTTCC 
ATCCCATTAA AAGATAACGG TATTTATTGC ATGGTTGCTG GTGAGCCGAT TGTGGATCAC 
ATCCGCAAAG CGGCAGAAGG CGCAGCCGCG ATTATCGCTA TCGGTTCCTG CTCTGCGTGG 
GGCGGTGTTG CCGCAGCTGG AGTTAACCCA ACTGGCGCAG TCAGCCTGCA AGAAGTTCTG 
CCAGGCAAAA CCGTTATCAA TATTCCGGGC TGCCCGCCGA ACCCGCACAA CTTCCTCGCG 
ACCGTTGCGC ACATCATCAC TTACGGCAAA CCGCCGAAAC TGGATGACAA AAATCGTCCG 
ACCTTCGCCT ATGGCCGTCT GATTCACGAA CACTGCGAAC GTCGCCCGCA CTTCGATGCT 
GGTCGTTTTG CCAAAGAGTT CGGTGATGAA GGCCACCGTG AAGGCTGGTG CCTGTACCAC 
CTCGGCTGTA AAGGGCCAGA AACTTACGGC AACTGCTCAA CGCTGCAATT CTGCGATGTT 
GGCGGCGTGT GGCCGGTAGC GATTGGTCAC CCATGCTATG GCTGTAACGA AGAAGGTATC 
GGCTTCCATA AAGGCATCCA TCAGCTTGCC AACGTCGAAA ATCAGACTCC GCGTTCACAG 
AAACCGGATG TTAACGCTAA AGAGGGCGGC AACGTCTCTG CAGGCGCTAT TGGTTTGCTC 
GGCGGTGTGG TTGGGCTGGT TGCCGGTGTC AGCGTGATGG CGGTGCGTGA ACTGGGTCGT 
CAGCAAAAGA AAGATAACGC TGACTCACGG GGAGAATAA

Protein sequence

MTGDNTLIHS HGINRRDFMK LCAALAATMG LSSKAAAEMA ESVTNPQRPP VIWIGAQECT 
GCTESLLRAT HPTVENLVLE TISLEYHEVL SAAFGHQVEE NKHNALEKYK GQYVLVVDGS 
IPLKDNGIYC MVAGEPIVDH IRKAAEGAAA IIAIGSCSAW GGVAAAGVNP TGAVSLQEVL 
PGKTVINIPG CPPNPHNFLA TVAHIITYGK PPKLDDKNRP TFAYGRLIHE HCERRPHFDA 
GRFAKEFGDE GHREGWCLYH LGCKGPETYG NCSTLQFCDV GGVWPVAIGH PCYGCNEEGI 
GFHKGIHQLA NVENQTPRSQ KPDVNAKEGG NVSAGAIGLL GGVVGLVAGV SVMAVRELGR 
QQKKDNADSR GE