Gene Ccel_0695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0695
Symbol
ID	7309554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	798781
End bp	799971
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	40%
IMG OID	643607634
Product	aldo/keto reductase
Protein accession	YP_002505054
Protein GI	220928145
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.994792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAACAA GGATAAATCA AAAGAACGGA GAAGAACTTT CTATTCTAGG TTTTGGGTGT 
ATGAGGTTTC CCACCAGGGC AGGCGGGATA GACGAACCGA GAGCTATTAG GATGATACGT 
TATGCTATAG AAAAGGGAAT TAATTATTTT GATACGGCTT ATATTTACCA TGGAGGGAAA 
AGTGAAAGCC TTCTGGGAAA AGCTTTAGCC GGAGGTTTTC GTGAAAAAGT CAAAATAGCT 
ACAAAACTGC CTTCTTTTAT GGTAAAGAAT CTTGATAATG CAAAAAAAAT ATTCAATACA 
CAATTGGAAC GGCTTCAAAC GGACTATATT GACTATTATC TGCTACATAT GCTTACAGAC 
AAAGCAGGCT TCGACAGACT TGCAGATATG GGAGTATTGA CGTGGATGGA AGAGCTTAAA 
GAAAAAGGTA CCATAAAAAA TATCGGGTTT TCCTTTCACG GAGCTAAAAT TGAATTCGAA 
CAGATTCTCA AGGCGTACCC TTGGGAGTTC TGCCAGATAC AATATAATTA TATGGACGAA 
AATAATCAGG CCACAAAGGA CGGATTATTA CTGGCTAATG ATATGGGAAT ACCTGTTATT 
GTCATGGAAC CTTTAAGAGG AGGAAAGCTG GTTACAAACC TGCCGGAAGA CGTAATAAAG 
GCATTCGCAG AATGCGACCG TGACAGGTCT CCGGCAGAAT GGGCCTTGAG GTGGATTTGG 
AATCATCCTC AGGTAAACGT GGTTCTGTCT GGGATGAGCG ATGAGGCACA GGTTGAAGAT 
AATATAAGGA TAGCCTCAGA TTCGCATGCC AATTCCCTTA CGGATGAAGA ACTTGGTGTC 
TTTGATAATG TCAAAAGGAT ATTACATGAA AGGACAAAAA TACCATGTAC GGCTTGCGGC 
TACTGTATGC CGTGTCCTGC AGGAGTTGAC ATACCGGGCT GCTTTTCACA TTATAACGAT 
AAGTACCTTA TTAAAGATAA AGGAACAAGA TTTCGGTATT ATCGGAACTT AGGAGCAGTA 
GCAGCACAGC CTTCCTATGC TTCACAGTGT AAAGACTGCG GGAAATGTGA AAGTCATTGT 
CCTCAAAAAA TAAGTATACG TTCCGAGCTT AAAACTGTCA GTAAGGAAAT GGAAAGTGTA 
TTTTATAAAG CAGGAATAGC AATTGCAAGG AAATTTATGA AAATCAAATA G

Protein sequence

MLTRINQKNG EELSILGFGC MRFPTRAGGI DEPRAIRMIR YAIEKGINYF DTAYIYHGGK 
SESLLGKALA GGFREKVKIA TKLPSFMVKN LDNAKKIFNT QLERLQTDYI DYYLLHMLTD 
KAGFDRLADM GVLTWMEELK EKGTIKNIGF SFHGAKIEFE QILKAYPWEF CQIQYNYMDE 
NNQATKDGLL LANDMGIPVI VMEPLRGGKL VTNLPEDVIK AFAECDRDRS PAEWALRWIW 
NHPQVNVVLS GMSDEAQVED NIRIASDSHA NSLTDEELGV FDNVKRILHE RTKIPCTACG 
YCMPCPAGVD IPGCFSHYND KYLIKDKGTR FRYYRNLGAV AAQPSYASQC KDCGKCESHC 
PQKISIRSEL KTVSKEMESV FYKAGIAIAR KFMKIK