Gene EcE24377A_1088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1088
Symbol	hyaB
ID	5588780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1111915
End bp	1113708
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	57%
IMG OID	640924791
Product	hydrogenase 1 large subunit
Protein accession	YP_001462204
Protein GI	157158524
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000594285
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTC AGTACGAAAC TCAGGGATAC ACCATCAATA ATGCCGGACG CCGCCTGGTG 
GTCGACCCGA TTACGCGCAT CGAAGGCCAC ATGCGCTGCG AAGTGAATAT TAACGATCAG 
AATGTGATCA CCAATGCCGT CTCCTGCGGC ACCATGTTTC GCGGGCTGGA GATCATTCTG 
CAAGGGCGCG ACCCGCGCGA TGCGTGGGCG TTCGTTGAAC GTATCTGCGG CGTCTGTACT 
GGCGTACACG CCCTGGCTTC GGTTTACGCC ATCGAAGATG CTATCGGTAT TAAAGTGCCG 
GACAACGCCA ATATCATCCG CAACATTATG CTGGCAACGC TCTGGTGCCA CGATCATCTG 
GTGCACTTCT ATCAGCTTGC CGGGATGGAC TGGATCGATG TGTTAGATGC GCTGAAAGCC 
GACCCGCGGA AAACCTCCGA ACTGGCGCAA AGTCTCTCCT CTTGGCCGAA ATCATCCCCG 
GGCTATTTCT TCGACGTACA AAACCGCCTG AAAAAATTCG TTGAAGGCGG GCAGTTGGGG 
ATCTTCCGCA ATGGCTACTG GGGGCACCCG CAGTACAAGT TGCCGCCAGA AGCCAACCTG 
ATGGGCTTTG CCCACTACCT CGAAGCTCTC GATTTCCAGC GTGAAATTGT GAAAATCCAC 
GCGGTCTTTG GCGGTAAAAA CCCGCATCCA AACTGGATTG TCGGCGGGAT GCCTTGCGCC 
ATCAACATTG ACGAAAGCGG CGCGGTCGGG GCAGTCAATA TGGAACGCCT GAACCTGGTG 
CAGTCAATTA TCACCCGCAC GGCGGACTTC ATTAACAACG TGATGATCCC CGACGCCTTA 
GCCATCGGTC AGTTCAACAA ACCGTGGAGC GAAATCGGCA CTGGTCTTTC TGATAAATGC 
GTTCTCAGCT ACGGCGCATT CCCGGATATT GCCAACGACT TTGGCGAGAA AAGTCTGCTG 
ATGCCTGGCG GCGCGGTGAT TAACGGCGAC TTCAACAATG TGCTGCCAGT GGATTTGGTT 
GATCCGCAGC AGGTGCAGGA GTTTGTCGAC CACGCCTGGT ATCGATATCC CAACGATCAG 
GTCGGGCGTC ATCCGTTCGA TGGCATCACC GACCCGTGGT ACAACCCCGG CGATGTCAAA 
GGCAGCGATA CCAACATTCA GCAGCTGAAT GAACAGGAAC GCTACTCGTG GATCAAAGCG 
CCACGCTGGC GCGGTAACGC GATGGAAGTG GGGCCGCTGG CGCGCACGTT AATCGCTTAT 
CACAAAGGCG ATGCTGCGAC CGTTGAGTCG GTCGATCGCA TGATGTCGGC GTTGAACCTG 
CCGCTTTCCG GTATCCAGTC AACGTTAGGC CGCATTTTGT GCCGCGCGCA CGAAGCGCAG 
TGGGCCGCAG GTAAGTTGCA GTATTTCTTC GACAAGCTGA TGACCAACCT GAAAAACGGC 
AATCTCGCCA CTGCTTCCAC GGAAAAATGG GAACCTGCAA CCTGGCCGAC AGAGTGCCGT 
GGTGTCGGTT TTACCGAAGC GCCGCGCGGG GCGTTAGGCC ACTGGGCCGC CATTCGCGAT 
GGCAAGATTG ATCTCTACCA GTGCGTGGTG CCGACCACCT GGAACGCCAG CCCGCGCGAT 
CCCAAAGGGC AGATTGGCGC TTATGAAGCG GCGCTGATGA ACACCAAAAT GGCGATCCCC 
GAGCAACCGC TGGAGATCCT GCGTACTCTG CACAGCTTTG ACCCGTGCCT CGCCTGTTCA 
ACACACGTGC TGGGCGACGA CGGTAGCGAG CTGATCTCCG TGCAGGTGCG TTAA

Protein sequence

MSTQYETQGY TINNAGRRLV VDPITRIEGH MRCEVNINDQ NVITNAVSCG TMFRGLEIIL 
QGRDPRDAWA FVERICGVCT GVHALASVYA IEDAIGIKVP DNANIIRNIM LATLWCHDHL 
VHFYQLAGMD WIDVLDALKA DPRKTSELAQ SLSSWPKSSP GYFFDVQNRL KKFVEGGQLG 
IFRNGYWGHP QYKLPPEANL MGFAHYLEAL DFQREIVKIH AVFGGKNPHP NWIVGGMPCA 
INIDESGAVG AVNMERLNLV QSIITRTADF INNVMIPDAL AIGQFNKPWS EIGTGLSDKC 
VLSYGAFPDI ANDFGEKSLL MPGGAVINGD FNNVLPVDLV DPQQVQEFVD HAWYRYPNDQ 
VGRHPFDGIT DPWYNPGDVK GSDTNIQQLN EQERYSWIKA PRWRGNAMEV GPLARTLIAY 
HKGDAATVES VDRMMSALNL PLSGIQSTLG RILCRAHEAQ WAAGKLQYFF DKLMTNLKNG 
NLATASTEKW EPATWPTECR GVGFTEAPRG ALGHWAAIRD GKIDLYQCVV PTTWNASPRD 
PKGQIGAYEA ALMNTKMAIP EQPLEILRTL HSFDPCLACS THVLGDDGSE LISVQVR