Gene Ccel_2232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2232
Symbol
ID	7310917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2610529
End bp	2612277
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	42%
IMG OID	643609164
Product	hydrogenase, Fe-only
Protein accession	YP_002506554
Protein GI	220929645
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACTG TAAACATTAC AATAGACGGT AAGAAACTTC AGGTTGAACA AGGCATAACA 
ATTTTAGAGG CAGCCAGACA GGCTAATATA AAGATACCTA CACTTTGCTT CCTCAAGGAT 
ATCAATGAAA TAGGTGCATG TAGGATGTGT CTGGTTGAAA TAAAGGGTGC GAGAGCGTTG 
CAAGCATCTT GCGTATATCC TGTTGCAGAA GGACTTGAAA TTTATACTCA GAGTCCGGAT 
GTCAGAGAGG CAAGAAAGGT AACCTTGGAG CTTATCCTTT CCAACCACGA CAAGAAATGT 
CTTACCTGTG TAAGAAGCAA AAACTGCGAG CTGCAAAACT TGGCTGAGGA ATTAAATATA 
AAAGATATAA GATTTGAAGG TGCATCAATT GATCTTCCTT TAGATGATTT TTCACCTTCA 
ATTGTCAGAG ACCCAAATAA ATGCGTGCTG TGCAAACGCT GTGTAAGTAT GTGTAAAAAC 
ATACAGACAG TTTCTGTTAT CAGTGCAGCT GAGAGAGGTT TCAAATCAAC GATTTCCTGT 
GCATTTGACA GGTCATTGGA AGAGGTACCG TGTACAATGT GCGGACAGTG TATCAGTGTT 
TGTCCTGTAG GAGCTTTAAG AGAGAAAGAT GACACTGACA AGGTATGGTC TGCTTTGGCT 
GACAAGGAAC TTCATGTTGT AGTACAGACA GCTCCTGCTG TTCGTGTTGC TCTGGGTGAG 
GAGTTTGGGC TTCCTATAGG GACCAGAGTT ACGGGGAAAA TGGCTGCTGC CTTGAACCAC 
CTGGGTTTTG CCAAAGTATT TGACACAGAT ACTGCTGCTG ATCTTACAAT TATGGAAGAA 
GGCACCGAGC TCCTAAACAG AATCAAAAAC GGTGGAAAGC TTCCTGTTAT AACTTCTTGT 
AGTCCGGGAT GGATAAAGTT CTGTGAGCAC AACTACCCTG AATTCCTTGA AAACCTATCA 
TCTTGTAAAT CACCACATGA AATGTTCGGT GCGGTGCTGA AAACTTACTA TGCTGAAAAG 
ATGGGTATCG ACCCTAAAAA AATATTTGTA GTGTCCGTAA TGCCATGTAC CGCAAAGAAG 
TTTGAAGCAC AAAGACCAGA GCTTTCCGCA ACAGGCTTGC CTGATGTTGA CGTAGTTATA 
ACTACCAGAG AGCTTGCAAG AATGATAAAG GAAGCAGGTA TCGATTTTAA TAATCTTGAG 
GACATGGATT TTGACGACCC AATGGGTAAC GCAACAGGAG CCGGCGTAAT ATTCGGTGCA 
ACCGGGGGAG TTATGGAAGC AGCTCTCAGA ACAGTATCTG AGATAGTTGC AGGAAAATCC 
TTTGAAGATA TTGAATATAC TGCTGTAAGA GGTATAGAGG GTATCAAGGA AGCAACAGTT 
GCTATAGGTG ACATGAAGGT TAAAGCGGCT GTAGCAAATG GTCTCGGCAA CGCAAGGAAG 
CTCCTTGACA GTATAAAAGC AGGAGAAGCA GCATATGACT TCGTTGAAAT AATGGCTTGT 
CCGGGCGGTT GTGTAAACGG CGGAGGACAG CCAATACAAC CTTCTTCTGT AAGAAGCTGG 
ACTGACTTGC GTACTGAACG TGCAAAGGCA ATATATGAAG AAGATGTAAG TCTTCCAATT 
AGAAAGTCAC ATGAAAACCC AGTAATCAAA GAAATGTATG ATAAATATTT CGGAGAGCCG 
GGAAGCCATA AGGCACATGA GATTTTACAC ACACATTATG CTGCAAGGGA AAACTACCCT 
GTAAAATAG

Protein sequence

MSTVNITIDG KKLQVEQGIT ILEAARQANI KIPTLCFLKD INEIGACRMC LVEIKGARAL 
QASCVYPVAE GLEIYTQSPD VREARKVTLE LILSNHDKKC LTCVRSKNCE LQNLAEELNI 
KDIRFEGASI DLPLDDFSPS IVRDPNKCVL CKRCVSMCKN IQTVSVISAA ERGFKSTISC 
AFDRSLEEVP CTMCGQCISV CPVGALREKD DTDKVWSALA DKELHVVVQT APAVRVALGE 
EFGLPIGTRV TGKMAAALNH LGFAKVFDTD TAADLTIMEE GTELLNRIKN GGKLPVITSC 
SPGWIKFCEH NYPEFLENLS SCKSPHEMFG AVLKTYYAEK MGIDPKKIFV VSVMPCTAKK 
FEAQRPELSA TGLPDVDVVI TTRELARMIK EAGIDFNNLE DMDFDDPMGN ATGAGVIFGA 
TGGVMEAALR TVSEIVAGKS FEDIEYTAVR GIEGIKEATV AIGDMKVKAA VANGLGNARK 
LLDSIKAGEA AYDFVEIMAC PGGCVNGGGQ PIQPSSVRSW TDLRTERAKA IYEEDVSLPI 
RKSHENPVIK EMYDKYFGEP GSHKAHEILH THYAARENYP VK