Gene Ccel_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0231
Symbol
ID	7309133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	260554
End bp	262701
Gene Length	2148 bp
Protein Length	715 aa
Translation table	11
GC content	44%
IMG OID	643607161
Product	glycoside hydrolase family 9
Protein accession	YP_002504598
Protein GI	220927689
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0413621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAAA AATTCCTTAA AACAACCAGT TTCATGCTAA TCATGTCACT GCTGGTGTCA 
TTGTTTGTCT ATGCTCCGAC AACTGTAAGA GCAGAAACTT CGCCGCGTGT GGGAGGCTCA 
TTTTACAATT ATGGCGAAGC CATGCAAAAG TCAATTCTTT TTTATAAGGC AAACCGTCTT 
GGGGATTTAC CAGACAACTA CGTTTTGCCC TATAGAGGTG ATGCTGCAAT GACTGACGGA 
AAGGATGTAG GTCTTGATCT AACCGGAGGA TGGGCAGATG CCGGAGACGG AATAAAATTT 
ACGCACCCTA TGTCATACGC CGCAGGACAA CTGGGATGGG CTGTTTACGA ATATCGTGAT 
GCCTTTGAAA AGTCTGGGCA ACTGGACGAT ATACTTGACG AAATAAAGTG GGCTACAGAC 
TTCTTTATAA AGGCACACCC AAGTCCGGAT GTATTGTACT ATATGTGCGG CTACGAAGAA 
TCAGACCATT CTGTATGGAT ACCACATGAG TTATTGGATT ATAAAACTGA CAGAAAGTCT 
TTCAAAGTTG ATTCTACAAC ACCGGGTTCA GATGTAGCAG GCCAAACTGC GGCAGCATTG 
GCTATTGCAT CAATTATATT TGAGCCAACA GACCCCGAGT ATGCAGAAAC CTGTCTTACA 
CATGCAAAGC AGCTGTTTAA GTTTGGTGAT ACATACAGGG GAAAAAATCC TCTAAAAACC 
CTGTATCCGT CAGGAGGCTA TCTGGATGAT CTGGCATGGG GTGCAATATG GCTGTATATT 
AAAACACAGG ATGCAACATA TCTTGAAAAG GCAAAGTCAA TTCTCCCTGT GACTGTTTTA 
GGCGGACAGC ACACGCACTG CTGGGATGAT GTAAGCTATG GTGCAGCCCT AAAAATAGCT 
CAGGCAGGTC GTGATGAAAG TTACGCTGCA ATGGTTGAAA AGAACCTTGA TTATTGGATG 
CCGGGGACAG GAATAAAATA CACTCCCGGA GGACTTGCAT GGCTTTCACA ATGGGGTTCC 
CTCCGTTATG CAACAACTGC GGCATTTTTA GCATTTGTAT GGTCGGATGA CAAAACAATA 
GGAACAGCTT CCAAAAAGCA GACTTACCAT GACTTTGCAG AAAGACAGAT AAACTATGCA 
CTTGGAGATA ACCCGCGTGG AGGTAGCTAT GAAGTAGGTT TCGGAGTAGA TGCACCTGAA 
CATCCTCATC ATCGAACTGC TCACGGTTCA TGGACAAGTA TGCTTAACGT CCCGACCTTC 
CACAGACATA TTCTCTATGG AGCATTAGTG GGAGGACCTT CTTCAGACGA CAGTTGGAAA 
GATGATATCA AAGATTATAC GCTGAATGAA GTAGCTACCG ACTATAATGC GGGTTTTGTA 
GGCTGTCTGG CTAAGATGTA CAGTATGTAT GGAGGGAATC CACTGGAAAA CTGGCCAAAG 
GCTGAGGATT TCAGATCACC TCAGGATAAT CTGACGGAGT ATTTCACAAG AGGCTGGATA 
ATTTATGAGG GCTACGGCAA GCTGAAAGTT ATGTTCCAGA TTAATAACCG CTCAGCTTGG 
CCTGCAACAA TGAAGGATAA AATGTCTACC CGATACTATA TGGATTTATC AGAAATATTT 
GAAGCAGGGG GAACGGTAGA TGACGTGCAA TTAACCCTTG AGGATAGTCA GGGGGCAAAG 
CTTATAGGAC TCAAGCAGTA CAAGGATAAT ATATATTACT TTACAGTTGA TTTTACGGGT 
ACACAGATAA TGCCGGCAGA GTGGGAAATG TGTGAAAAGG ATGCAACTGT ACAGATTGAA 
TACAAAAATG GCGTAGGTTC CAATGAAAAT GACTGGTCAT ACCAGAACAT AAGCGGCCCG 
CCGGACTTTG ATGCAGTATC CTTTGCAGGA ATGTCCAAAT ACATACCTGT ATACGACAAC 
GGTAAGCTTC TTTGGGGAGA GGAACCAGCT GGGAAGGAAC CGGAAGTCAT GTATGGCGAT 
ATAAATAATG ACGGAAATAT TGATGCGATA GATTTTGCAC TGCTCAAAAA AATACTTATG 
GGCGACACAT CAGGCAATGT CAATTTGACT GCCGCCGATT TTAACAAGGA CGGAGATATA 
AATGCTATTG ACTATGCGGC GTTAAAGAGC TATTTGCAAC GTGGATAA

Protein sequence

MRKKFLKTTS FMLIMSLLVS LFVYAPTTVR AETSPRVGGS FYNYGEAMQK SILFYKANRL 
GDLPDNYVLP YRGDAAMTDG KDVGLDLTGG WADAGDGIKF THPMSYAAGQ LGWAVYEYRD 
AFEKSGQLDD ILDEIKWATD FFIKAHPSPD VLYYMCGYEE SDHSVWIPHE LLDYKTDRKS 
FKVDSTTPGS DVAGQTAAAL AIASIIFEPT DPEYAETCLT HAKQLFKFGD TYRGKNPLKT 
LYPSGGYLDD LAWGAIWLYI KTQDATYLEK AKSILPVTVL GGQHTHCWDD VSYGAALKIA 
QAGRDESYAA MVEKNLDYWM PGTGIKYTPG GLAWLSQWGS LRYATTAAFL AFVWSDDKTI 
GTASKKQTYH DFAERQINYA LGDNPRGGSY EVGFGVDAPE HPHHRTAHGS WTSMLNVPTF 
HRHILYGALV GGPSSDDSWK DDIKDYTLNE VATDYNAGFV GCLAKMYSMY GGNPLENWPK 
AEDFRSPQDN LTEYFTRGWI IYEGYGKLKV MFQINNRSAW PATMKDKMST RYYMDLSEIF 
EAGGTVDDVQ LTLEDSQGAK LIGLKQYKDN IYYFTVDFTG TQIMPAEWEM CEKDATVQIE 
YKNGVGSNEN DWSYQNISGP PDFDAVSFAG MSKYIPVYDN GKLLWGEEPA GKEPEVMYGD 
INNDGNIDAI DFALLKKILM GDTSGNVNLT AADFNKDGDI NAIDYAALKS YLQRG