Gene EcDH1_2671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2671
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2846072
End bp	2847865
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	57%
IMG OID
Product	nickel-dependent hydrogenase large subunit
Protein accession	ACX40304
Protein GI	260449882
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00020942
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTC AGTACGAAAC TCAGGGATAC ACCATCAATA ATGCCGGACG CCGCCTGGTG 
GTCGACCCGA TTACGCGCAT CGAAGGCCAC ATGCGCTGCG AAGTGAATAT TAACGATCAG 
AATGTGATCA CCAATGCCGT CTCCTGCGGC ACCATGTTTC GCGGGCTGGA GATCATCCTA 
CAAGGGCGCG ACCCGCGCGA TGCGTGGGCG TTCGTTGAAC GTATCTGCGG CGTCTGTACT 
GGCGTACACG CCCTGGCTTC GGTTTACGCC ATCGAAGATG CTATCGGTAT TAAAGTGCCG 
GACAACGCCA ATATCATCCG CAACATTATG CTGGCAACGC TCTGGTGCCA CGATCATCTG 
GTGCACTTCT ATCAGCTTGC CGGGATGGAC TGGATCGATG TGTTAGATGC GCTGAAAGCC 
GACCCGCGGA AAACCTCCGA ACTGGCGCAA AGTCTCTCCT CTTGGCCGAA ATCATCCCCT 
GGCTATTTCT TCGACGTACA AAACCGCCTG AAAAAATTTG TTGAAGGCGG GCAGTTGGGG 
ATCTTCCGCA ATGGCTACTG GGGGCACCCG CAGTACAAAC TGCCGCCAGA AGCTAACCTG 
ATGGGCTTTG CCCACTATCT CGAAGCTCTC GATTTCCAGC GTGAAATTGT CAAAATCCAC 
GCGGTCTTTG GCGGTAAAAA CCCGCATCCA AACTGGATTG TCGGCGGGAT GCCTTGCGCC 
ATCAACATTG ACGAAAGCGG CGCGGTCGGG GCAGTCAATA TGGAACGCCT GAACCTGGTG 
CAGTCAATTA TCACCCGCAC GGCGGACTTC ATTAACAACG TGATGATCCC CGACGCCTTA 
GCCATCGGTC AGTTCAACAA ACCGTGGAGC GAAATCGGCA CTGGTCTTTC TGATAAATGC 
GTTCTCAGCT ACGGCGCATT CCCGGATATT GCCAACGACT TTGGCGAGAA AAGTCTGCTG 
ATGCCTGGCG GCGCGGTGAT TAACGGCGAC TTCAACAATG TGCTGCCAGT GGATTTGGTT 
GATCCGCAGC AGGTGCAGGA GTTTGTCGAC CACGCCTGGT ATCGATATCC CAACGATCAG 
GTCGGGCGTC ATCCGTTCGA TGGCATCACC GACCCGTGGT ACAACCCCGG CGATGTCAAA 
GGCAGCGATA CCAACATTCA GCAGCTGAAT GAACAGGAAC GCTACTCGTG GATCAAAGCG 
CCACGCTGGC GCGGTAACGC GATGGAAGTG GGGCCGCTGG CGCGCACGTT AATCGCTTAT 
CACAAAGGCG ATGCTGCGAC CGTTGAGTCG GTCGATCGCA TGATGTCGGC GTTGAACCTG 
CCGCTTTCCG GTATCCAGTC AACGTTAGGC CGCATTTTGT GCCGCGCGCA CGAAGCGCAG 
TGGGCCGCAG GTAAGTTGCA GTATTTCTTC GACAAGCTGA TGACCAACCT GAAAAACGGC 
AATCTCGCCA CTGCTTCCAC GGAAAAATGG GAACCTGCAA CCTGGCCGAC AGAGTGCCGT 
GGTGTCGGTT TTACCGAAGC GCCGCGCGGG GCGTTAGGCC ACTGGGCCGC CATTCGCGAT 
GGCAAGATTG ATCTCTACCA GTGCGTGGTG CCGACCACCT GGAACGCCAG CCCGCGCGAT 
CCCAAAGGGC AGATTGGCGC TTATGAAGCG GCGCTGATGA ACACCAAAAT GGCGATCCCC 
GAGCAACCGC TGGAGATCCT GCGTACTCTG CACAGCTTTG ACCCGTGCCT CGCCTGTTCA 
ACACACGTGC TGGGCGACGA CGGTAGCGAG CTGATCTCCG TGCAGGTGCG TTAA

Protein sequence

MSTQYETQGY TINNAGRRLV VDPITRIEGH MRCEVNINDQ NVITNAVSCG TMFRGLEIIL 
QGRDPRDAWA FVERICGVCT GVHALASVYA IEDAIGIKVP DNANIIRNIM LATLWCHDHL 
VHFYQLAGMD WIDVLDALKA DPRKTSELAQ SLSSWPKSSP GYFFDVQNRL KKFVEGGQLG 
IFRNGYWGHP QYKLPPEANL MGFAHYLEAL DFQREIVKIH AVFGGKNPHP NWIVGGMPCA 
INIDESGAVG AVNMERLNLV QSIITRTADF INNVMIPDAL AIGQFNKPWS EIGTGLSDKC 
VLSYGAFPDI ANDFGEKSLL MPGGAVINGD FNNVLPVDLV DPQQVQEFVD HAWYRYPNDQ 
VGRHPFDGIT DPWYNPGDVK GSDTNIQQLN EQERYSWIKA PRWRGNAMEV GPLARTLIAY 
HKGDAATVES VDRMMSALNL PLSGIQSTLG RILCRAHEAQ WAAGKLQYFF DKLMTNLKNG 
NLATASTEKW EPATWPTECR GVGFTEAPRG ALGHWAAIRD GKIDLYQCVV PTTWNASPRD 
PKGQIGAYEA ALMNTKMAIP EQPLEILRTL HSFDPCLACS THVLGDDGSE LISVQVR