Gene ECH74115_1208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1208
Symbol	hyaA
ID	6968975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1216292
End bp	1217410
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	55%
IMG OID	643385203
Product	nickel-dependent hydrogenase 1, small subunit
Protein accession	YP_002269698
Protein GI	209397207
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.428667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAACG AGGAAACATT TTACCAGGCC ATGCGGCGTC AGGGCGTTAC CCGGCGCAGC 
TTTCTCAAAT ATTGTAGTCT GGCTGCCACG TCGCTGGGAT TAGGCGCGGG AATGGCACCA 
AAGATTGCCT GGGCGCTGGA GAACAAACCG CGCATTCCGG TGGTATGGAT CCACGGTCTG 
GAATGCACCT GCTGTACCGA ATCTTTTATC CGCTCCGCTC ACCCGCTGGC AAAGGACGTC 
ATCCTTTCCC TGATTTCCCT CGATTACGAC GATACTTTGA TGGCTGCCGC CGGAACCCAG 
GCGGAAGAAG TCTTTGAAGA CATCATCACG CAATACAATG GCAAATATAT CCTCGCAGTA 
GAAGGTAATC CGCCGCTGGG CGAGCAGGGG ATGTTCTGTA TCAGCAGCGG TCGACCGTTT 
ATTGAGAAAC TCAAACGTGC CGCTGCCGGA GCCAGCGCGA TTATCGCCTG GGGAACCTGT 
GCGTCCTGGG GCTGCGTGCA GGCCGCGCGA CCTAATCCGA CACAGGCAAC GTCTATCGAC 
AAAGTCATCA CCGACAAACC CATTATCAAA GTACCTGGCT GCCCGCCGAT CCCGGATGTG 
ATGAGCGCCA TCATTACTTA CATGGTGACC TTTGATCGCT TGCCAGATGT CGACAGAATG 
GGTCGTCCAC TGATGTTTTA TGGTCAGCGT ATCCACGATA AATGCTATCG CCGCGCTCAC 
TTCGACGCCG GAGAGTTCGT CCAGAGTTGG GATGATGACG CTGCCCGCAA AGGTTATTGC 
CTGTACAAAA TGGGCTGCAA AGGGCCTACC ACCTATAACG CCTGTTCCTC CACACGCTGG 
AATGATGGCG TTTCTTTCCC AATCCAGTCT GGTCACGGCT GCCTGGGCTG TGCGGAAAAT 
GGTTTCTGGG ATCGCGGTTC GTTCTACAGC CGCGTGGTCG ATATTCCACA AATGGGTACT 
CATTCCACCG CCGATACCGT CGGTTTAACC GCGCTTGGTG TGGTGGCAGC GGCTGTTGGT 
GTGCACGCAG TCGCCAGCGC CGTTGACCAG CGCAGACGTC ATAATCAGCA ACCTACAGAA 
ACCGAACATC AGCCAGGCAA TGAGGATAAA CAGGCATGA

Protein sequence

MNNEETFYQA MRRQGVTRRS FLKYCSLAAT SLGLGAGMAP KIAWALENKP RIPVVWIHGL 
ECTCCTESFI RSAHPLAKDV ILSLISLDYD DTLMAAAGTQ AEEVFEDIIT QYNGKYILAV 
EGNPPLGEQG MFCISSGRPF IEKLKRAAAG ASAIIAWGTC ASWGCVQAAR PNPTQATSID 
KVITDKPIIK VPGCPPIPDV MSAIITYMVT FDRLPDVDRM GRPLMFYGQR IHDKCYRRAH 
FDAGEFVQSW DDDAARKGYC LYKMGCKGPT TYNACSSTRW NDGVSFPIQS GHGCLGCAEN 
GFWDRGSFYS RVVDIPQMGT HSTADTVGLT ALGVVAAAVG VHAVASAVDQ RRRHNQQPTE 
TEHQPGNEDK QA