Gene EcSMS35_3281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3281
Symbol	hybB
ID	6144333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3358311
End bp	3359489
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	54%
IMG OID	641618111
Product	putative hydrogenase 2 b cytochrome subunit
Protein accession	YP_001745261
Protein GI	170680419
COG category	[C] Energy production and conversion
COG ID	[COG5557] Polysulphide reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCATG ATCCACAACC GCTGGGCGGC AAAATCATCA GTAAACCGGT CATGATTTTT 
GGACCGTTAA TCGTCATCTG TATGCTCCTG ATTGTGAAGC GTCTGGTGTT CGGTCTGGGC 
TCAGTCTCTG ACCTGAACGG CGGCTTCCCG TGGGGCGTGT GGATCGCGTT TGACCTGCTG 
ATCGGCACCG GCTTTGCCTG TGGCGGCTGG GCGCTGGCGT GGGCGGTATA CGTCTTTAAC 
CGTGGGCAAT ACCATCCGCT GGTGCGTCCG GCGCTGTTGG CGAGTCTGTT TGGTTACTCA 
CTGGGTGGCT TGTCGATCAC TATTGACGTG GGTCGCTACT GGAACCTGCC GTACTTCTAC 
ATTCCGGGTC ACTTCAACGT GAACTCGGTA CTGTTCGAGA CGGCGGTCTG TATGACCATC 
TACATCGGCG TGATGGCACT GGAGTTTGCT CCAGCACTGT TTGAACGTCT GGGCTGGAAG 
GTGTCGCTAC AGCGTCTGAA CAAGGTTATG TTCTTCATCA TTGCACTTGG CGCGCTGCTG 
CCGACCATGC ACCAGTCTTC AATGGGGTCG CTGATGATCT CGGCGGGCTA CAAGGTGCAT 
CCGTTGTGGC AGAGCTATGA AATGTTGCCG TTGTTCTCGC TGCTGACGGC GTTCATCATG 
GGCTTCTCGA TTGTCATCTT TGAAGGTTCG CTGGTGCAGG CGGGTCTGCG TGGCAACGGT 
CCGGATGAAA AGAGTCTGTT CGTTAAGCTG ACCAACACCA TCAGTGTGTT GCTGGCGATT 
TTCATCGTGC TGCGCTTTGG CGAGCTTATC TATCGCGACA AGCTGTCGTT AGCGTTTGCC 
GGTGACTTCT ATTCCGTGAT GTTCTGGATT GAAGTCCTGC TGATGCTCTT CCCGCTGGTC 
GTTCTGCGTG TGGCGAAGCT GCGTAATGAT TCCCGCATGC TGTTCCTGTC AGCACTGAGC 
GCGCTGTTAG GTTGTGCAAC CTGGCGTCTG ACCTATTCGC TGGTGGCATT CAACCCGGGT 
GGCGGTTACG CCTACTTCCC GACCTGGGAA GAACTGTTGA TTTCTATTGG TTTTGTGGCT 
ATTGAGATTT GCGCTTACAT CGTACTCATT CGTCTACTGC CGATACTTCC TCCTTTAAAA 
CAAAACGATC ATAATCGTCA TGAGGCGAGC AAAGCATGA

Protein sequence

MSHDPQPLGG KIISKPVMIF GPLIVICMLL IVKRLVFGLG SVSDLNGGFP WGVWIAFDLL 
IGTGFACGGW ALAWAVYVFN RGQYHPLVRP ALLASLFGYS LGGLSITIDV GRYWNLPYFY 
IPGHFNVNSV LFETAVCMTI YIGVMALEFA PALFERLGWK VSLQRLNKVM FFIIALGALL 
PTMHQSSMGS LMISAGYKVH PLWQSYEMLP LFSLLTAFIM GFSIVIFEGS LVQAGLRGNG 
PDEKSLFVKL TNTISVLLAI FIVLRFGELI YRDKLSLAFA GDFYSVMFWI EVLLMLFPLV 
VLRVAKLRND SRMLFLSALS ALLGCATWRL TYSLVAFNPG GGYAYFPTWE ELLISIGFVA 
IEICAYIVLI RLLPILPPLK QNDHNRHEAS KA