Gene ECH74115_4308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4308
Symbol	hybA
ID	6970299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3987590
End bp	3988576
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	55%
IMG OID	643388037
Product	hydrogenase 2 protein HybA
Protein accession	YP_002272475
Protein GI	209398622
COG category	[C] Energy production and conversion
COG ID	[COG0437] Fe-S-cluster-containing hydrogenase components 1
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAGAC GTAATTTTAT TAAAGCAGCC TCCTGCGGGG CATTGCTGAC GGGCGCGCTG 
CCGTCTGTCA GTCATGCGGC TGCTGAAAAC CGCCCGCCAA TTCCGGGATC GCTGGGGATG 
TTGTACGACT CGACCTTGTG CGTAGGCTGC CAGGCTTGCG TCACCAAGTG TCAGGATATC 
AACTTCCCTG AACGTAACCC GCAAGGGGAA CAGACCTGGT CGAACAACGA CAAACTGTCG 
CCGTATACCA ATAACATCAT TCAAGTGTGG ACCAGCGGCA CAGGGGTCAA CAAAGACCAG 
GAGGAGAACG GCTACGCGTA CATTAAGAAA CAGTGTATGC ACTGCGTCGA TCCGAACTGT 
GTCTCTGTGT GCCCGGTCTC TGCACTGAAA AAAGATCCGA AAACCGGCAT TGTCCATTAC 
GACAAAGACG TGTGCACCGG TTGCCGTTAC TGCATGGTCG CCTGTCCGTA CAACGTGCCG 
AAGTACGACT ACAACAACCC GTTTGGTGCG CTGCATAAGT GCGAGCTGTG CAACCAGAAA 
GGTGTGGAAC GTCTCGATAA AGGCGGTCTG CCTGGCTGCG TAGAAGTGTG CCCGGCGGGC 
GCGGTGATTT TTGGTACGCG TGAAGAGCTG ATGGCGGAGG CGAAAAAACG TCTGGCGCTG 
AAGCCTGGCA GCGAATACCA CTATCCGCGT CAGACGCTGA AATCTGGCGA CACTTACCTG 
CATACGGTGC CGAAATATTA TCCGCATCTG TACGGCGAGA AAGAGGGCGG CGGTACTCAG 
GTTCTGGTAC TGACGGGTGT GCCTTATGAA AATCTCGACC TGCCGAAACT GGACGATCTT 
TCTACCGGTG CGCGTTCCGA AAATATTCAA CACACCCTGT ATAAAGGCAT GATGCTACCA 
CTGGCTGTGC TGGCGGGCTT GACCGTGCTG GTTCGTCGCA ACACCAAAAA CGACCATCAC 
GACGGAGGAG ACGATCATGA GTCATGA

Protein sequence

MNRRNFIKAA SCGALLTGAL PSVSHAAAEN RPPIPGSLGM LYDSTLCVGC QACVTKCQDI 
NFPERNPQGE QTWSNNDKLS PYTNNIIQVW TSGTGVNKDQ EENGYAYIKK QCMHCVDPNC 
VSVCPVSALK KDPKTGIVHY DKDVCTGCRY CMVACPYNVP KYDYNNPFGA LHKCELCNQK 
GVERLDKGGL PGCVEVCPAG AVIFGTREEL MAEAKKRLAL KPGSEYHYPR QTLKSGDTYL 
HTVPKYYPHL YGEKEGGGTQ VLVLTGVPYE NLDLPKLDDL STGARSENIQ HTLYKGMMLP 
LAVLAGLTVL VRRNTKNDHH DGGDDHES