Gene Ccel_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1229
Symbol
ID	7310026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1505662
End bp	1507269
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	41%
IMG OID	643608150
Product	Carbohydrate binding family 6
Protein accession	YP_002505565
Protein GI	220928656
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.166566
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTAAAA AAATTAAAAA GTTTTCAGTT TTTATGGTAG CTCTTTTATT TTTGTCTGTT 
TATAGTTTTA ACTTAGTATT TGCAGACTAT CCCATATTTT ACCAGAGGTA TACGGCCGAT 
CCTTCAGGTT TAGAAGCCAA TGGGAGACTT TATCTGTATT CTTCTCATGA TGTATATGAC 
CCTAACAAAC CGGGTTATAT AATGAATGAC ATTACATGTA TATCTACCGA TGACTTGAAG 
AATTGGACAG ACCATGGAGA GGTTTTTAAA GCTTCTGGCT GGGCATCATT ATCTTGGGCA 
CCGGTAGTTG TTGCAAAAAA CAATAAATAT TATATGTATT TTGGAAACGG TGCTGGAGGT 
ATAGGTGTTT CGGTAAGCGA CAGTCCTACA GGTCCTTTCA AGGATGCACT GGGAAAAGCT 
TTGATAAATG GGAGCACACC CGGGGTAAAT CCCCCCAGCG GATTTTGGTG CTTTGATCCG 
GGAGCCTTTG TGGACGATAA CGGTCAGGCA TATTTGTATT TCGGAGGAAA CGGGGAAGGT 
AATACACGCG TTATAAAGCT CAACAGCGAC ATGATAAGTC TTAATGGTTC TGCATCTGGT 
ATTACAGCTC CAATCTTTTT TGAGGATTCG TGGATACACA AGTATAACGG CAAGTACTAT 
TATTCCTATT CAACAAATTT CTCAAAGGGT GCTGCTACCA TAGATTATAT GATGAGCGAC 
AATCCAATAA CCGGATTTCA GTACAAGGGC ACCGTTCTGG CAAATCCCCC TTTAAACGAA 
GGCAACAATA ATCACCATAC TATATTTCCA TTCAAAGGGG ATTGGTATAT TGCTTATCAC 
AACAGGGCTC TTGCAATAGC CAATGGTGCT GCCAGCGGTG ATGCACGGAC GTATCAAAGA 
AGTGTATGTA TAGATAAACT CAATTACAAT GCAGATGGAA CCATGCAGAA GGTTACAATT 
ACGACAGATG GTCTTAAACA GCTTAAGTAT GTAAATCCTT ATGTAACAAA CGAGGCCGAA 
ACCATGGCAC AGGGAAGCGG GATCAACACG GAAGAATGTA CCGAAGGAGG CCGTGATGTT 
GCCTTTATTG AAAACGGAGA CTGGATCAAG GTGAGAGGTG TTGATTTTGG TACTGCTGGA 
GCAGCCTCCT TTGACGCAAG GGTAGCATCA TCAACCAGCG GAGGAAATAT TGAAATCCGT 
CTCGACAGCC TTACAGGAAA GCTTGTAGGG ACTTGTGTTG TTGAGAATAC AAGTGGTTGG 
CAGAATTGGA CTACAAAGAC CTGTTCTGTA AGCGGTACTA CAGGTGTCCA CGATCTGTAC 
CTGAAGTTTA CCGGCGACAG CGGGTATCTG TTTAATCTAA ACTCATGGAG ATTCAATACT 
TCAGGAGCAA AAACAGTATA TGGCGATCTT GATGGCAGCG GTGATATTAA TGCTATTGAC 
TTCTCACTTA TGAAGCAATA TCTGCTTGGT TCAATAACCA AATTTCCTAT AGAAGATGGG 
ATAATTGCTG CGGATTTGGA TGCCAGCGGT ACAATTGATG CGATCGACTA TGTACTTCTC 
AAAGAATATT TACTTGGTAA GAGGACCCAA TTTCCTGCTG AATTATAA

Protein sequence

MFKKIKKFSV FMVALLFLSV YSFNLVFADY PIFYQRYTAD PSGLEANGRL YLYSSHDVYD 
PNKPGYIMND ITCISTDDLK NWTDHGEVFK ASGWASLSWA PVVVAKNNKY YMYFGNGAGG 
IGVSVSDSPT GPFKDALGKA LINGSTPGVN PPSGFWCFDP GAFVDDNGQA YLYFGGNGEG 
NTRVIKLNSD MISLNGSASG ITAPIFFEDS WIHKYNGKYY YSYSTNFSKG AATIDYMMSD 
NPITGFQYKG TVLANPPLNE GNNNHHTIFP FKGDWYIAYH NRALAIANGA ASGDARTYQR 
SVCIDKLNYN ADGTMQKVTI TTDGLKQLKY VNPYVTNEAE TMAQGSGINT EECTEGGRDV 
AFIENGDWIK VRGVDFGTAG AASFDARVAS STSGGNIEIR LDSLTGKLVG TCVVENTSGW 
QNWTTKTCSV SGTTGVHDLY LKFTGDSGYL FNLNSWRFNT SGAKTVYGDL DGSGDINAID 
FSLMKQYLLG SITKFPIEDG IIAADLDASG TIDAIDYVLL KEYLLGKRTQ FPAEL