Gene ECH74115_3704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3704
Symbol	hyfB
ID	6968338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3422030
End bp	3424048
Gene Length	2019 bp
Protein Length	672 aa
Translation table	11
GC content	55%
IMG OID	643387498
Product	hydrogenase 4 subunit B
Protein accession	YP_002271951
Protein GI	209398249
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG0651] Formate hydrogenlyase subunit 3/Multisubunit Na+/H+ antiporter, MnhD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.726938
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	89
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCCC TGCAATTATT AACCTGGTCG CTGATCCTCT ATCTGTTTGC CAGTCTGGCT 
TCGCTGTTTT TACTCGGTCT GGACAGACTG GCTATTAAGC TTTCCGGCAT CACATCGCTG 
GTGGGCGGCG TGATTGGCAT CATCAGCGGA ATTACGCAAT TACATGAAGG CGTAACTTTA 
GTTGCCCGTT TTGCCACCCC TTTTGACTTT GCCGATTTAA CCCTGCGAAT GGATAGCCTC 
TCGGCATTTA TGGTGCTGGT TATCTCCTTG CTGGTGGTGG TTTGTTCGCT CTATTCATTG 
ACTTATATGC GCGAATACGA GGGCAAAGGC GCGGCGGCGA TGGGCTTCTT TATGAATATT 
TTCATCGCAT CGATGGTTGC CCTGCTGGTG ATGGACAACG CTTTTTGGTT CATCGTGCTG 
TTTGAAATGA TGTCGCTGTC TTCCTGGTTT CTGGTCATTG CCAGGCAGGA TAAAACGTCG 
ATCAACGCTG GCATGCTCTA CTTTTTTATC GCCCACGCCG GATCGGTGCT GATTATGATC 
GCCTTCTTGC TGATGGGGCG CGAAAGCGGC AGCCTAGATT TTGCCAGTTT CCGCACGCTT 
TCACTTTCTC CGGGGCTGGC GTCGGCGGTG TTCCTGCTGG CCTTTTTCGG TTTTGGCGCG 
AAAGCCGGGA TGATGCCGTT GCACAGCTGG TTGCCGCGCG CTCACCCTGC CGCACCATCG 
CACGCTTCGG CGTTGATGTC TGGCGTAATG GTCAAAATCG GTATTTTCGG CATCCTGAAA 
GTGGCGATGG ATCTGCTGGC GCAAACGGGT TTGCCGCTGT GGTGGGGCAT TCTGGTGATG 
GCGATCGGCG CAATCTCCGC GCTCCTGGGC GTGCTGTATG CGCTGGCGGA ACAGGATATC 
AAACGGCTGC TGGCCTGGAG TACCGTCGAA AACGTCGGCA TTATTTTGCT GGCAGTCGGT 
GTGGCGATGG TCGGTCTGTC ACTACACGAC CCGCTGCTCA CCGTGGTTGG ACTGCTCGGC 
GCACTGTTTC ATCTGCTCAA CCATGCGCTG TTCAAAGGGC TGCTATTTCT CGGCGCGGGC 
GCGATTATTT CGCGTTTGCA TACCCACGAC ATGGAAAAAA TGGGGGCACT GGCGAAACGG 
ATGCCGTGGA CAGCCGCAGC ATGCCTGATT GGTTGCCTCG CGATATCAGC CCTTCCTCCG 
CTGAATGGTT TTATCAGCGA ATGGTACACC TGGCAGTCGC TGTTCTCACT AAGTCGTGTG 
GAAGCCGTAG CGCTACAACT TGCGGGTCCT ATTGCTATGG TGATGCTGGC AGTCACTGGT 
GGGCTGGCAG TAATGTGCTT CGTCAAAATG TACGGTATTA CTTTCTGTGG TGCGCCGCGC 
AGTACACACG CTGAAGAGGC ACAGGAAGTG CCAAATACGA TGATCGTCGC CATGCTACTG 
CTCGCGGCAC TCTGCGTATT AATTGCGCTT AGTGCCAGTT GGCTGGCACC GAAGATAATG 
CATATTGCCC ATGCGTTTAC CAATACCCCT CCCGTCACTG TCGCCAGCGG AATAGCACTT 
GTACCCGGCA CGTTTCATAC ACAGGTCACC CCCTCATTAC TGTTGCTGTT ACTACTGGCG 
ATGCCTTTGC TGCCTGGCCT TTACTGGCTG TGGTGTCGTT CGCGCCGCGC AGCGTTTCGT 
CGCACAGGAG ATGCCTGGGC ATGCGGCTAC GGCTGGGAAA ATGCGATGGC CCCGTCAGGC 
AATGGCGTGA TGCAGCCGCT GCGTGTGGTC TTCTCTGCGC TATTTCGTCT ACGACAACAG 
CTCGACCCTA CGCTGAGGCT AAATAAAGGT CTTGCGCACG TCACCGCCAG GGCTCAGAGC 
ACAGAACCCT TCTGGGATGA GCGGGTGATC CGCCCCATCG TGAGCGCCAC CCAACGGCTG 
GCCAAAGAAA TACAGCATCT GCAAAGCGGC GACTTTCGTC TCTATTGCCT GTATGTGGTC 
GCCGCACTGG TTGTGCTGCT AATCGCTATT GCCGTCTAA

Protein sequence

MDALQLLTWS LILYLFASLA SLFLLGLDRL AIKLSGITSL VGGVIGIISG ITQLHEGVTL 
VARFATPFDF ADLTLRMDSL SAFMVLVISL LVVVCSLYSL TYMREYEGKG AAAMGFFMNI 
FIASMVALLV MDNAFWFIVL FEMMSLSSWF LVIARQDKTS INAGMLYFFI AHAGSVLIMI 
AFLLMGRESG SLDFASFRTL SLSPGLASAV FLLAFFGFGA KAGMMPLHSW LPRAHPAAPS 
HASALMSGVM VKIGIFGILK VAMDLLAQTG LPLWWGILVM AIGAISALLG VLYALAEQDI 
KRLLAWSTVE NVGIILLAVG VAMVGLSLHD PLLTVVGLLG ALFHLLNHAL FKGLLFLGAG 
AIISRLHTHD MEKMGALAKR MPWTAAACLI GCLAISALPP LNGFISEWYT WQSLFSLSRV 
EAVALQLAGP IAMVMLAVTG GLAVMCFVKM YGITFCGAPR STHAEEAQEV PNTMIVAMLL 
LAALCVLIAL SASWLAPKIM HIAHAFTNTP PVTVASGIAL VPGTFHTQVT PSLLLLLLLA 
MPLLPGLYWL WCRSRRAAFR RTGDAWACGY GWENAMAPSG NGVMQPLRVV FSALFRLRQQ 
LDPTLRLNKG LAHVTARAQS TEPFWDERVI RPIVSATQRL AKEIQHLQSG DFRLYCLYVV 
AALVVLLIAI AV