Gene Ccel_1009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1009
Symbol
ID	7309836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1254633
End bp	1255646
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	43%
IMG OID	643607936
Product	aldo/keto reductase
Protein accession	YP_002505351
Protein GI	220928442
COG category	[R] General function prediction only
COG ID	[COG0656] Aldo/keto reductases, related to diketogulonate reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAACG ATATAATCAA TCCAGATTTA GTTCCCCAGA GAATATTACG TGGGGGAGAC 
AAGATGCCTG CAATAGGCAT GGGAACTTTC GGTTCGGACA GGTTTTCGGC CGAAGATATT 
GCAGCGGCAG TTAAAGGTGC GGCAGAAGTG GGCTTCAGAT TGTTTGACTG TGCTGCGGTA 
TACGGAAATG AGCATTTAAT CGGAGAAGTT TTCGAAGATA TTATGAAATC GGGAATCAAA 
AGAGAGGAAT TGTTCATTAC CTCAAAGGTA TGGAATGATA TGCACGGCAA AGGTGATGTA 
ATGCTGTCCT GTGCAAAGAC CTTGAAGGAT TTGCGTCTTG ACTATATAGA TTTATATTTT 
GTTCACTGGC CATTCAGAAA TTTCCACCCG AAGGGAGCCC CACCGGACTA TCACAATAAG 
GATGCAAGAC CATTTTCAAT TGAACAGTAC ATGGAAACCT GGTATCAGAT GGAAAGACTT 
CAGAAGGCCG GTTATGTAAA GCATATCGGT GCCTCCAACA TGACAATTCC AAAGTTAAAG 
GAATTGATCA AATATGCTAC CATCATGCCT TCTGCAATAG AAATGGAGCT CCACCCATGC 
TTCCAGCAGC CTGAATTATT CAAATTTGTG CTTGACCATG GTATTCAGCC TATCGGCTTC 
TGTCCTATCG GTTCTCCAAC AAGACCGGAT CGTGACAAGA CTTCGGAGGA CTATATAGAT 
ATAGAGGATC CAGTTATTGT TGAAATAGCA AAGGCACATA ATGTCCATCC GGCTGTTATA 
TGTATTAAAT GGGCTGTTCA GAGAGGACAG ACTCCTATAC CGTTCTCAAT CTACAGAAAC 
GAATATGCAA GTAACCTTAG ATGTGCGGTT GAAGACCCAC TTACAGAGGA GGAAATGAAG 
AAAATCGAAG GTGTGGATAA AAACTGCCGT CTGATTAAAG GTCAGGTTTT CCTTTGGGAA 
GGAGCTAAAG ACTGGACCGA TCTGTGGGAC GTTAATGGAG AAATAACAAA ATAA

Protein sequence

MSNDIINPDL VPQRILRGGD KMPAIGMGTF GSDRFSAEDI AAAVKGAAEV GFRLFDCAAV 
YGNEHLIGEV FEDIMKSGIK REELFITSKV WNDMHGKGDV MLSCAKTLKD LRLDYIDLYF 
VHWPFRNFHP KGAPPDYHNK DARPFSIEQY METWYQMERL QKAGYVKHIG ASNMTIPKLK 
ELIKYATIMP SAIEMELHPC FQQPELFKFV LDHGIQPIGF CPIGSPTRPD RDKTSEDYID 
IEDPVIVEIA KAHNVHPAVI CIKWAVQRGQ TPIPFSIYRN EYASNLRCAV EDPLTEEEMK 
KIEGVDKNCR LIKGQVFLWE GAKDWTDLWD VNGEITK