Gene SeD_A3498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3498
Symbol	hybO
ID	6875318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3359695
End bp	3360813
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	642786490
Product	hydrogenase 2 small subunit
Protein accession	YP_002217127
Protein GI	198244463
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.271513
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAG ATAATACTCT CATCACTTCT CACGGCATTA ACCGTCGTGA TTTCATGAAG 
CTTTGTGCAG CACTGGCCGC TACTATGGGG CTCAGTAGCA AAGCCGCCGC AGAAATGGCA 
GAATCGGTAT CCAATCCACA GCGTCCGCCC GTTATCTGGA TTGGCGCTCA GGAGTGTACC 
GGTTGTACCG AATCACTGCT TCGTGCTACA CACCCAACCG TTGAAAACCT CGTTCTGGAG 
ACTATCTCTC TGGAATACCA CGAGGTACTT TCCGCCGCAT TCGGTCACCA GGTCGAAGAA 
AACAAACATA ACGCTCTGGA GAAGTATAAA GGGCAATATG TTCTGGTGGT GGATGGTTCT 
ATCCCACTAA AAGATAACGG TATCTACTGC ATGGTTGCCG GCGAGCCGAT CGTGGATCAC 
ATCCGCAAAG CCGCTGACGG CGCAGCCGCG ATTATCGCTA TCGGTTCCTG CTCGGCATGG 
GGCGGCGTTG CTGCGGCTGG CGTAAACCCA ACCGGCGCTG TCAGTCTGCA GGAAGTCTTA 
CCGGGCAAAA CGGTTATCAA TATTCCAGGT TGTCCGCCAA ACCCGCATAA CTTCCTGGCG 
ACCGCCGCGC ATATCATCAC TTACGGCACG CCGCCGAAGC TGGATGCGAA AAATCGTCCA 
ACCTTTGCCT ATGGCCGTCT GATTCATGAG CATTGCGAAC GTCGTCCACA CTTCGACGCA 
GGCCGTTTTG CCAAAGAATT TGGCGACGAA GGCCACCGTC AGGGCTGGTG TCTCTACCAT 
CTTGGCTGTA AAGGGCCGGA AACCTGGGGC AACTGTTCTA CGTTACAGTT CTGTGACGTT 
GGCGGCGTCT GGCCAGTGGC GATCGGTCAT CCTTGCTATG GCTGTAACGA AGAAGGTATC 
GGCTTCCATA AGGGCATTCA CCAGCTTGCT CATGTCGAAA ACCAAACTCC GCGTTCAGAG 
AAACCTGACG TCAATATGAA AGAAGGCGGC AATATCTCTG CGGGCGCTGT CGGTCTGCTT 
GGCGGCGTAG TCGGTCTGGT TGCCGGCGTC AGCGTGATGG CGGTACGTGA ACTGGGGCGT 
CAGCAAAAGA AAGATAACGC TGACTCACGG GGAGAATAA

Protein sequence

MTGDNTLITS HGINRRDFMK LCAALAATMG LSSKAAAEMA ESVSNPQRPP VIWIGAQECT 
GCTESLLRAT HPTVENLVLE TISLEYHEVL SAAFGHQVEE NKHNALEKYK GQYVLVVDGS 
IPLKDNGIYC MVAGEPIVDH IRKAADGAAA IIAIGSCSAW GGVAAAGVNP TGAVSLQEVL 
PGKTVINIPG CPPNPHNFLA TAAHIITYGT PPKLDAKNRP TFAYGRLIHE HCERRPHFDA 
GRFAKEFGDE GHRQGWCLYH LGCKGPETWG NCSTLQFCDV GGVWPVAIGH PCYGCNEEGI 
GFHKGIHQLA HVENQTPRSE KPDVNMKEGG NISAGAVGLL GGVVGLVAGV SVMAVRELGR 
QQKKDNADSR GE