Gene Clim_2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2097
Symbol
ID	6355075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2312955
End bp	2314229
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	59%
IMG OID	642669692
Product	nickel-dependent hydrogenase large subunit
Protein accession	YP_001944104
Protein GI	189347575
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTG ACTGTTCGAT CGATATTCGC CATCTGACAA GGGTTGAAGG CCACGGAAAT 
ATCCGGATTA CGGTAAGCGG AGGAAAACTG CTGGAAGCCC GGTGGGCGGT TGTTGAAACC 
CCGAGGTTTT TCGAGGTGAT GGTCAAAGGC ATGAGCGCCG AACGGGTGCC ATTTCTCACC 
TCGCGCATCT GCGGCATCTG TTCGATCAGC CATGCCCTGG CGAGCATCAG GGCGCTCGAA 
CGGGCTATGC TGATCGCCCC GCCTCCAGCT GCGGAAACAA CCAGGCTGCT TGCCATGCAC 
GGAGAAACCC TGCAGAGCCA CGCGCTGCAC CTGTTTTTTC TTGCCGCACC GGATTTCGCC 
GGCACGTCGG GTGTACTGCC TCTGCTGGAG TCGCAACCGG AACTGGTCAG GGCCGGTCTC 
GGGCTCAAGG AACTCGGCAA CGAAATCAGC GCCGTAACAA CGGGACGGTG CACCCATCCG 
GTCAGCCTCG TGGTGGGAGG GCTCAGCAAG GCGCCAGACA AAATTCGGCT GCAGCAGCTC 
CTCGACATGA TCGGTGAACG GAAGTCCGCG CTCGGCATTG CCTGCGATTT CTTCGGTACC 
CTCGATATTC CCCGGTTCGA GCGTGAAACC GAATTCATCT CGCTCCACAA CGGCGCAACC 
TACCCCTTCA TCGGAGGCGA CCTGCTCTCC ACCGACGGCG TCAGGAAAGA AGAGAACGAC 
TACCTCCCGA TGACGAACGA GTACGTCGCA GAATTCTCCA CCTCGAAGTT CACCCGGTGC 
AGCCGCGAGT CATCGGCGGC GGGAGCGCTC GCACGCTTCA ACAACAACAG CGGATTCCTG 
CACCCCGAAG CGAAAAAAGC CGCCGAAAAA CTGGGACTCA GGCCGATCTG CCACAACCCC 
TTCATGTGCA ACATCACGCA GCTCGTCGAG TGCGTGCACA TCCTCTACGA CGCAGAAACG 
CTCATCCAGA AATTGCTCGA CACCGACCTT TCCGATATCC GCACCCCGTT CGCCCCGAAG 
GCAGGCATCG CAACGGGAGC CGTCGAGGCG CCCCGCGGCA TCCTCTACCA CCACATGGAA 
ACCGATGAGG AGGGCAAGGT AGTGAAAGCC GACTGCATCA TTCCCACCAC GCAGAACAAC 
GCCAATATCC ACAACGACCT GCAGGCCCTT GCCAGGCAGG CGTTCGAAGA GGGAAAAAAC 
GACCGGGAGA TCGAAAAACT CGCCGAAATG CTGGTGCGCT CTTACGACCC CTGCATTTCA 
TGCTCGGTGC ACTGA

Protein sequence

MKRDCSIDIR HLTRVEGHGN IRITVSGGKL LEARWAVVET PRFFEVMVKG MSAERVPFLT 
SRICGICSIS HALASIRALE RAMLIAPPPA AETTRLLAMH GETLQSHALH LFFLAAPDFA 
GTSGVLPLLE SQPELVRAGL GLKELGNEIS AVTTGRCTHP VSLVVGGLSK APDKIRLQQL 
LDMIGERKSA LGIACDFFGT LDIPRFERET EFISLHNGAT YPFIGGDLLS TDGVRKEEND 
YLPMTNEYVA EFSTSKFTRC SRESSAAGAL ARFNNNSGFL HPEAKKAAEK LGLRPICHNP 
FMCNITQLVE CVHILYDAET LIQKLLDTDL SDIRTPFAPK AGIATGAVEA PRGILYHHME 
TDEEGKVVKA DCIIPTTQNN ANIHNDLQAL ARQAFEEGKN DREIEKLAEM LVRSYDPCIS 
CSVH