Gene Ccel_2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2303
Symbol
ID	7312348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2685484
End bp	2687172
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	41%
IMG OID	643609232
Product	hydrogenase, Fe-only
Protein accession	YP_002506620
Protein GI	220929711
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAACAA TGATAATTGA CGGACAGCAT ATTGAATTTA CCGATGAAAA AAATATATTG 
GCAGTAATCA GAAAAGTGGG TATTGAGCTT CCTACCTTTT GCTATCACTC AGAACTCAGT 
GTTTACGGTG CGTGCAGAAT GTGTATGGTT GAGGATAAAT GGGGCAGCAC CATAACCTCA 
TGTTCAACAC CTCCAAAGGA CGGTATGGAG GTATGGACAA ATACAGATAA GCTGAAAAAA 
CATAGAAAAA TGATATTGGA GCTGCTACTT GCCAATCATG ACAGGGATTG TACAACCTGT 
GAAAAAAGTG GAAGATGTAA GCTGCAGGAA ATAGCTTTGA AGGTGGGAGT AAAGAAAGTA 
AGGTTCGGAC AGGAAAAAAA GGAGATACCT ATTGATGATA TGGGACCATC CGTAATCAGA 
AATCCAAATA AGTGCATACT ATGCGGAGAC TGTGTCAGGG CATGTCAGGA AATTCAGGGT 
GTCGGAGTAC TGGACTTTGC TTACAGAGGA TCAAATTTGC AGGTAACAAC AGCCTTCAAT 
AAATCATTGC AGGAAGTTGA TTGTGTTAAC TGCGGTCAGT GCAGAGTTGT TTGTCCTACT 
GGAGCATTGA TGATAAAGAA AGACATAGAC AGAGCATATA AAGCTCTTCA TGACAAAAAT 
AAGCGTGTTA TCGCACAGAT AGCACCTGCT GTACGTGTTG CCATCGGAGA AGATTTTGGT 
CTTCAGCCGG GGGAGATATC AATGGGTAAG ATAGTTTCAG CACTTAGGAA GCTTGGCTTT 
GATCAGGTAT TTGACACAGC TGTTGGAGCA GACCTGACTG TTATAGAAGA AGCCGAAGAA 
CTGATGGACA GGATTCAGAG AAAAGAAAAA CTACCTTTGT TCAGCTCATG CTGTCCTGCT 
TGGTTCAAGT ATGCAGAACA GAAGCACCCG GATCTAATGG AAAATGTGTC CTCCTGCCTG 
TCTCCACAGC AGATGTTTGG AGCGGTTATA AAGGAACAGT ATAAAAGGGA AAAAGCTTCT 
GACGAAAAGG AAAACGTTGT TATTGCAATA ATGCCGTGTA CCGCTAAGAA GTATGAAGCT 
GCAAGACCTG AAAACACCAT AAACGGTGAA AGACAGGTAG ATATGGTAAT AACGACACAG 
GAACTTGCAA TTATGATACA GGAAAACGGT ATAGTATTCA ATGAGCTTGA AGACGAAGCT 
ATTGATATGC CTTTCGGATT TACCAGCGGT GCAGGTGTTA TATTTGGTGT CAGCGGAGGT 
GTGTCCGAAG CGGTACTTCG TTATTACTAC AAGGAAAGAA ATGCTTCAAC ACTCAGAGGT 
CTTTCATATT GCGGAGTCAG AGGTATGGAA GGAGTTAAGG AGGCATCAGC CGAAATTGAC 
GGCAGAACCG TAAGAATCGG AATAGTTCAC GGTCTTAAAA ATGCTGAAAA GCTTATAAGA 
AGAATAAAGA GCGGAGAAGA GAAATTTGAC TTTATTGAAG TTATGGCTTG CCCCGGTGGT 
TGTATTGGTG GTGCAGGACA GCCTATTCCT CAAAATGAAA ATGTAAGAAA ACTAAGGGCA 
AAGGGTATAT ACAAGGTAGA CAAGTCATTA CCGATAAAAC GTTCTGATGA CAATCCTACC 
ATAGACGCAT TGTACAACGG TATATTAAAC AGTAATAGAA ATATTCTCCA TAGGAACGGA 
AAACATTAA

Protein sequence

MGTMIIDGQH IEFTDEKNIL AVIRKVGIEL PTFCYHSELS VYGACRMCMV EDKWGSTITS 
CSTPPKDGME VWTNTDKLKK HRKMILELLL ANHDRDCTTC EKSGRCKLQE IALKVGVKKV 
RFGQEKKEIP IDDMGPSVIR NPNKCILCGD CVRACQEIQG VGVLDFAYRG SNLQVTTAFN 
KSLQEVDCVN CGQCRVVCPT GALMIKKDID RAYKALHDKN KRVIAQIAPA VRVAIGEDFG 
LQPGEISMGK IVSALRKLGF DQVFDTAVGA DLTVIEEAEE LMDRIQRKEK LPLFSSCCPA 
WFKYAEQKHP DLMENVSSCL SPQQMFGAVI KEQYKREKAS DEKENVVIAI MPCTAKKYEA 
ARPENTINGE RQVDMVITTQ ELAIMIQENG IVFNELEDEA IDMPFGFTSG AGVIFGVSGG 
VSEAVLRYYY KERNASTLRG LSYCGVRGME GVKEASAEID GRTVRIGIVH GLKNAEKLIR 
RIKSGEEKFD FIEVMACPGG CIGGAGQPIP QNENVRKLRA KGIYKVDKSL PIKRSDDNPT 
IDALYNGILN SNRNILHRNG KH