Gene Ccel_1234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1234
Symbol
ID	7310031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1514537
End bp	1516147
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	41%
IMG OID	643608155
Product	Carbohydrate binding family 6
Protein accession	YP_002505570
Protein GI	220928661
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.115461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAT TTAAAAAAGG TTTTTCAATT TTTTTAGGCT TGTTCATGAT AATATCATCA 
TTCGGTTCCA TGGTTAACGC TGCAGCAAAC CCAAATCCGT CATGGAACGT TGACGAGAGG 
GTTATATTTC ACAATCAGTG CAGCCCATAT GATTACTATG CGGCTAAAGA CCCTACTATC 
GTTTATTATA ACGGTAAATA CCTTGTTTAT TACACAGGTG CAAATAAAAG CGGCGGTTGG 
CAAATGTGTT TTACCTCAGC TAGCACAATT TCCGGTCTGA AAACAGCTCC ACGTACCTAT 
ATGAGTAAAA TAGGAGAAAG CTATTTCTGT GCACCTGAAT TGTTCTACTA TGAACCGCAG 
AAATTATGGT ACCTTGTTTA CCAGGATGGT ACGCACGGGG CAGCTTATGC AACTACAACA 
ACTCCTGATG ATCCGAATTC ATGGTCCGGG CCAAAATCCT TTGGTATATC CGGCAACATG 
GGATGGGATT ATTATATAAT ATGCGATGAT CAGTACGCTT ATATGTACAA TACACCAAGT 
GATGGATCAG GAAAACTCTA TATGAGAAAA ACCACTCTGG CAAACTTCCC TAATAAGGGC 
TGGAGCACAC CTACTGTTGC ATGCTCAAAT GTTTTTGAGG GAGCGGCGGT CTATAAGAGT 
CTTGCCGATG GTCAGTACTA TATGCTTATT GAAGCAATGA TAGATGGCAG AAGCTACGAG 
TTGTTTACAT CCTCCAGTGC AGGAGGCCCT TGGACTCTGG TCAATAATAA ATGGGCAACA 
AGGAGCAATC TTACAAAATA TAATGCGGAC AAGTGGACAA CTAACGTATC ACATGGTGAA 
CTTATACGTG CAGGATATAA TCAGAAACTA GAAATAAATG ATATAAACAA GGTGGATTTC 
CTTATTCAGG GTACTACCAA TATGAACGCT GAATATCAGC AAATTATATG GGATTTGGGC 
CTTATCAGAA ATTATACCGG AAGCCCCGAT ACGCCTGTTA CACCAAGAAC TGCTTTTGAA 
AAAATAGAAG CTGAGAGCTG GAATGACCAG TCTGGAATCC AGAATGTAAC CTGCGATGAA 
GGTACCGAGG CTGTGGGTTA TACCGAAAAC GGAGATTACA GCGTATACAA GAGCATAGAT 
TTCGGAAGTG GTGCTACCAG CTTCCAGGCA AGAGTATCAA GTGCCACCAG CGGAGGCAAG 
ATTGAAATAA GACTTGACAG TGCAACTGGT ACCTTGGTTG GAACTTGCAC AGTTAGCGGA 
ACAGGCAGCT GGCAGACCTT CGCGGATGTG AACTGTACTG TAAGCGGTGT AAGCGGCAAA 
CATGACTTAT ACCTGAAATA TATAGGAGAC AGCGGATACT TAATCAATCT TAACTGGTTT 
AAATTCAGCA ACACACCTGT TGTTTCAGAT AAATTGGGTG ATGTAAATTC TGATGGGCAA 
ATAGATGCCA TAGATTTACA ATTATTGAAA AAATATCTTT TAGGATCCGG AACAATAGAA 
AATACAAAGC TTGGTGATTT GAATGCTAGC GGAGATGTTG ACGCAATCGA TTTTTCACTG 
CTCAAACAAT ACCTTCTTGG GCAGATAACA AAATTCCCTG CTCAGGCGTG A

Protein sequence

MNIFKKGFSI FLGLFMIISS FGSMVNAAAN PNPSWNVDER VIFHNQCSPY DYYAAKDPTI 
VYYNGKYLVY YTGANKSGGW QMCFTSASTI SGLKTAPRTY MSKIGESYFC APELFYYEPQ 
KLWYLVYQDG THGAAYATTT TPDDPNSWSG PKSFGISGNM GWDYYIICDD QYAYMYNTPS 
DGSGKLYMRK TTLANFPNKG WSTPTVACSN VFEGAAVYKS LADGQYYMLI EAMIDGRSYE 
LFTSSSAGGP WTLVNNKWAT RSNLTKYNAD KWTTNVSHGE LIRAGYNQKL EINDINKVDF 
LIQGTTNMNA EYQQIIWDLG LIRNYTGSPD TPVTPRTAFE KIEAESWNDQ SGIQNVTCDE 
GTEAVGYTEN GDYSVYKSID FGSGATSFQA RVSSATSGGK IEIRLDSATG TLVGTCTVSG 
TGSWQTFADV NCTVSGVSGK HDLYLKYIGD SGYLINLNWF KFSNTPVVSD KLGDVNSDGQ 
IDAIDLQLLK KYLLGSGTIE NTKLGDLNAS GDVDAIDFSL LKQYLLGQIT KFPAQA