Gene Ccel_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1231
Symbol
ID	7310028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1509068
End bp	1510642
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	43%
IMG OID	643608152
Product	Carbohydrate binding family 6
Protein accession	YP_002505567
Protein GI	220928658
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0177163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TAAGCAAAAT TGCAGCTCTC TTATTAGTAC TTACTTTGTT TATTCCAACA 
GTAGGCTATG CAGACAATCC AATAGTGCAG ACTTTATATA CTGCTGACCC TGCCCCTATG 
ATATATAACG ATACATGCTA CGTGTACACG GGACATGACG AGGATACACT GGTAAATGAT 
TTCTTTACTA TGAATGACTG GAGATGTTAC TCCTCAACTG ATATGGTGAA TTGGACAGAT 
AACGGTTCGC CACTGTCATA CTCTTCGTTC AGTTGGGCAA AAGGGGATGC ATGGGCAGGC 
CAATGTATTC AAAGAAATGG AAAGTTTTAT TATTATGTTC CTTTGACCCC GAAAACCGGA 
GGGACGGCAA TCGGTGTTGC AGTATCAGAT AGCCCTACAG GCCCATTTAA AGATCCCCTT 
GGAAAACCAT TAGTTAGTAC TGGCAGCGGC GACATTGACC CGACAGTATA TATCGATGAT 
GACGGACAGG CTTATCTGTA CTGGGGCAAT CCAAACCTTT ACTATGTAAA GTTGAATCAG 
GATATGGTTT CCTACTCAGG CAGTATTGTA AAGGTACCTT TGACAACTGC AAGTTTCGGA 
ACAAGAAGTA AAACCGACAG ACCAACTACA TACGAGGAGG GACCATGGTT TTACAAGCGT 
AACAGTTTGT ACTATATGGT ATTTGCAGGC GGCCCCATAT CAGAGCATAT AGGTTATTCC 
ACCAGTACCG GGCCTACAGG GCCTTGGACT TATCGTGGTA AAATCATGCC TACCCAGGGC 
AGCAGCTTTA CAAATCATCC GGGGGTAGCC GATTTTAAAG GTAATTCCTA TTTCTTCTAT 
CACAATGGTG CTTTGCAGGG TGGAGGAGGG TTTCACCGTT CGGTGTGTGT AGAACAATTT 
AAATATAATG CTGACGGTAC TTTTCCAACC ATAAATATGA CTACAACCGG CTCTACCCAA 
ATCGGCAATC TTAATCCATT TATTAAAACT GAGGCGGAAA CAATCTGCTG GGAATCAGGT 
ATTGAAACGG AAAAGTGCAG TGAAGGCGGA ATGAATGTAG CCTTTATAGA AAATGGGGAC 
TATATAAAGG TAAAAGGTGT TGATTTTGGT ACGGGTGCAG CAGCCTTTAC TGCCAGAGTT 
GCTTCTGCAA CCGACGGCGG GAATCTAGAA CTTCGGCTTG ACAGCCCAAC AGGTAAACTT 
GTGGGGACTT GTGCAGTTAC AAGCACAGGA GGATGGCAGA CATGGGTCGA TAAGACCTGT 
ACGGTAAGCG GTGCCGAGGG GATACATGAC TTGTACCTGA AATTTACAGG TGGAAGCGGT 
TATCTGTTCA ATTTTAACTG GTGGAAGTTT ATCAAAGCTG GGAATACCTC TGTTATTGGA 
GATCTCAATG GAGACAAAAG CGTGGATGCG GCAGATTATG CCATGATGAA GAAATATCTT 
TTGGGATTAA TTGAAGATTT TCCGGCAGAA AACGATATTG AAGCCGGAGA CTTAAATAAA 
GACAGCGTCA TTGACGCACT TGATTTTGCA GTTTTTAAAA AATATCTGCT TGGTACAATT 
CCAAGTTTAC CATGA

Protein sequence

MKKVSKIAAL LLVLTLFIPT VGYADNPIVQ TLYTADPAPM IYNDTCYVYT GHDEDTLVND 
FFTMNDWRCY SSTDMVNWTD NGSPLSYSSF SWAKGDAWAG QCIQRNGKFY YYVPLTPKTG 
GTAIGVAVSD SPTGPFKDPL GKPLVSTGSG DIDPTVYIDD DGQAYLYWGN PNLYYVKLNQ 
DMVSYSGSIV KVPLTTASFG TRSKTDRPTT YEEGPWFYKR NSLYYMVFAG GPISEHIGYS 
TSTGPTGPWT YRGKIMPTQG SSFTNHPGVA DFKGNSYFFY HNGALQGGGG FHRSVCVEQF 
KYNADGTFPT INMTTTGSTQ IGNLNPFIKT EAETICWESG IETEKCSEGG MNVAFIENGD 
YIKVKGVDFG TGAAAFTARV ASATDGGNLE LRLDSPTGKL VGTCAVTSTG GWQTWVDKTC 
TVSGAEGIHD LYLKFTGGSG YLFNFNWWKF IKAGNTSVIG DLNGDKSVDA ADYAMMKKYL 
LGLIEDFPAE NDIEAGDLNK DSVIDALDFA VFKKYLLGTI PSLP