Gene DET0147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET0147
Symbol
ID	3230473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	+
Start bp	143111
End bp	144832
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	53%
IMG OID	637119715
Product	[Fe] hydrogenase, large subunit HymC, putative
Protein accession	YP_180897
Protein GI	57235003
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG1034] NADH dehydrogenase/NADH:ubiquinone oxidoreductase 75 kD subunit (chain G) [COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTACGC TAAATATTGA CAACAAGCAG ATAAGCGTAC CTGAAGGTAC GACTATTATG 
CAGGCCGCCA AGCAGGCCAA TATCAATATC CCCCACCTGT GTTATTTTGA AGGCCTGAAA 
AGTTACAGCG GCTGCCGGGT ATGTGTGGTG GAAATAGAGG GTGAACCCCG TCTGGCTACG 
TCCTGCTCAC GCAAGGTAGC CGAAGGCATG AAGGTTAATA CCCATTCCGC CAGAGTACGC 
CGCGCCCGCC GCACCATACT TGAAATCCTG CTGGCCAATC ACCCGCAGGA CTGTTTTAAC 
TGTGAGCGCA ACCAGAACTG TGATTTGCTG CGTCTGGCGT TTGAATGCGG AGTTAAAAAG 
CTGCGCTTTG AAGAAAGCGA AAAGCGGGTG CTGCCTATAG ACAGTACCAG CCCCAGTATT 
ATCCGTGACC CCAATAAATG TATTGCCTGC GGCCGGTGTG TCCGCGTCTG CCACGATATA 
CAAACAGTCA ATGCCATCGG TTTTATAAAT AAAGGCCCGG ATACCATGGT GGCAACCTCC 
ATGGACAGGG GTATGGGCAA TGTTGCCTGT GCCAACTGCG GCCAGTGCAT ACTGGTCTGC 
CCGGTGGGTG CTATCAAGGA ACGCTCGGCG GTGGATGCTG TCTGGGCGGC TATAGCAGAC 
CCCACTAAAC ACGTGGTTGT TCAGGAAGCT CCTTCGGTCA GGGTTTCTCT GGGCGAAGAG 
CTGGGCTTGC CGGCAGGTAC GCTGGTTGCC AAAAAGATGT ATGCCGCTTT AAGGCGTCTG 
GGTTTTGACG CCGTATTTGA TACCAACTTT ACCGCTGACC TGACCATTAT GGAAGAGGGT 
TCGGAACTGG TGGAACGGGT TAAGGACGGC GGGGTGCTTC CCCAGATAAC CTCCTGCTGC 
CCCGGCTGGG TCAAGTTTAT GGAGCATTAT TATCCTGAAC TTGCGCCCAA CGTTTCCTCC 
GCCAAGTCCC CCCAGCAAAT GTTCGGGGCG GTCTGCAAGA CCTATTATGC CGAAAAATCC 
GGCATAGACC CCAAGGATAT TATCAATGTT TCGGTCATGC CCTGTACGGC CAAGAAATTT 
GAGTGCCAGC GTCCCGAAAT GAATGACAGC GGCTTTAAAG ACGTGGATTA TGTCTTGACT 
ACCCGTGAGC TGGCCCGGAT GATAAAAGAA GCCGGACTGG ATTTTGCTTC ACTGGACGAA 
GAGCCTGCCG AAGACTTGCT GGGTCTTTAT ACCGGTGCCG CCACTATCTT CGGGGCTACC 
GGCGGTGTTA TGGAAGCGGC TATCCGCAGT GCCTACACCC TGATAACCGG GCGCGAACTG 
GAAAACCTGG ATATAGAACC GGTGCGCGGT CTGGAAGGCA TTAAGACCGC CAGCGTTAAT 
ATTGACGGGT TAGAGGTTAA AGTAGCGGTG GCTCACGGGC TGGGAAATGC CCGTCACCTG 
CTGGATGAGA TAAAAGAGGG TGTTTCGCCC TACCACTTTA TAGAAATCAT GGCCTGTCCC 
GGCGGTTGTG TCGGCGGCGG CGGCCAGCCA ATACGCTTTG ATTCCACTCT CAAGAAAAAG 
CGCGGCGAAG CCCTTTACGA AGAAGACAGA AACATGGCCA AGAGGTGTTC CCACCACAAC 
CCGTCAGTAG AGAAGATATA TAAAGACTAT CTGGAGAAGC CGCTGGGCAA GCGTTCTCAC 
AAACTGCTGC ATACCGAATA TACCAGTCGC CCGGTAGTTT AA

Protein sequence

MVTLNIDNKQ ISVPEGTTIM QAAKQANINI PHLCYFEGLK SYSGCRVCVV EIEGEPRLAT 
SCSRKVAEGM KVNTHSARVR RARRTILEIL LANHPQDCFN CERNQNCDLL RLAFECGVKK 
LRFEESEKRV LPIDSTSPSI IRDPNKCIAC GRCVRVCHDI QTVNAIGFIN KGPDTMVATS 
MDRGMGNVAC ANCGQCILVC PVGAIKERSA VDAVWAAIAD PTKHVVVQEA PSVRVSLGEE 
LGLPAGTLVA KKMYAALRRL GFDAVFDTNF TADLTIMEEG SELVERVKDG GVLPQITSCC 
PGWVKFMEHY YPELAPNVSS AKSPQQMFGA VCKTYYAEKS GIDPKDIINV SVMPCTAKKF 
ECQRPEMNDS GFKDVDYVLT TRELARMIKE AGLDFASLDE EPAEDLLGLY TGAATIFGAT 
GGVMEAAIRS AYTLITGREL ENLDIEPVRG LEGIKTASVN IDGLEVKVAV AHGLGNARHL 
LDEIKEGVSP YHFIEIMACP GGCVGGGGQP IRFDSTLKKK RGEALYEEDR NMAKRCSHHN 
PSVEKIYKDY LEKPLGKRSH KLLHTEYTSR PVV