Gene Ccel_0141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0141
Symbol
ID	7309052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	157776
End bp	159869
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	41%
IMG OID	643607070
Product	Glycosyl hydrolase 67 middle domain protein
Protein accession	YP_002504509
Protein GI	220927600
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3661] Alpha-glucuronidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTATAAAT CAAACGTAAA TGATGAGCTA TACGGTGCAA ATGGATATAA CTGTTGGCTT 
GGATATCATC TGCTTGAAAA CGGAGAGCTA AGAGAAAACT ATTCCCAATG GGCCTCCAAT 
ATAGTAATTT CTAAAGAACC GGACGAAATA AAAATAGCTT TAAGCGAACT TAAAAGCGGA 
ATAAATGGAA TATTGGGAGT TGATGCTGTT GTTGTAACCA GAGAGCCGGA ACAAAGCTCC 
TGCATTGCTC TGGGTGTGCT TGGAAGAGGA CAGAACATTG ATAGCTATGT AAAATACGAT 
GAGGTAGTGC AAATCGGTAA TGAAGGCTTT ATAATCAAGG CATTTAAAAC TGGTAATAGT 
GAAATCGTTG TTGTTGCCGG TACAACCACA AAAGGCCTAC TCTACGGAGT ATTCAGTCTG 
TTGAGACTAC TGCAAACTGA GGCAACGATT TCAGGTATCT TGAAGATTGA AAATCCTGCA 
AACCAGCTTC GTATTATAAA CCATTGGGAC AATATCGATG GAAGTATTGA AAGAGGTTAT 
GCGGGTAAAT CCATTTTCTT TACGGATAAT AAAGTAACCG AAGACCTTGG CAGAATAAAA 
GACTATGCAA GACTTTTATG CTCTGTTGGA ATAAACAGTA TTGTTATAAA CAATGTTAAT 
GTTCACAAGT ATGAGAGTAT GCTTATAACA GACAAATATC TCAATGATGT TGCAAGTCTG 
GCTCAAATAT TCCGTGACTA CGGTATAAAG CTGTATCTTA GTGCAAATTT TGCAAGTACT 
ATTGAAATAG GAGGACTAGC TACGGCCGAC CCGTTGGACC CGCAAGTAAG AAAGTGGTGG 
AAGGAGAAGG CCGATGAGAT ATACTCGTTG ATACCTGACT TTGGTGGTTT TCTGATTAAG 
GCAGATTCCG AATTCCGGCC TGGGCCTTTT ACTTATGGAC GTACCCATGC GGATGGTGCC 
AATATGCTTG CAGAAGCCTT GGAACCATAC GGCGGCCTGG TTATATGGAG ATGCTTTGTA 
TACAACTGTA TGCAGGATTG GCGTGATCGC ATCACAGATA GGGCTAGGGC TGCCTATGAC 
AACTTTATGC CTCTTGACGG CTTGTTCAGG GAAAATGTAT TGCTTCAGAT AAAAAACGGC 
CCTATGGACT TTCAGGTGCG TGAGCCGGTA TCTCCTTTAT TCGGGGGATT ACAAAAAACA 
AACCAGCTAT TGGAGCTTCA GATTACTCAG GAATACACAG GACAACAAAA GCACTTATGC 
TATCTGGTGC CAATGTGGAA GGAGATACTG GACTTTGATA CAATGGCAAA GGGTAGGAAC 
ACAAGTGTGA AAAAAATTAT CACAGGATCC GTGTTCAATA ACAAATTAGG CGGAATGGCA 
GCGGTAACAA ATATAGGAAA TGACCTGAAC TGGACGGGCC ACCAAATGGC TCAGTCAAAT 
ACATACGGTT ATGCACGTTT GTGTTGGAAT CCTGATTTAT CAGCTGAAAA GATTACTGAT 
GAATGGGTTA GAATGACTTA CTCAAATTAT GAAAAGGTTG TGAATACCGT AAAGGAAATG 
CTGCTGGGTT CATGGAGAAC CTATGAGAAT TATACTTCTC CTCTGGGAAT AGGTTGGATG 
GTTAATCCCA ATCACCATTA CGGGCCGAAT GTAGACGGAT ATGAATATGA TAAGTGGGGA 
ACATATCACA GGGCAGACCA TAAGGGGATC GGAGTAGACA GAACAGTCAA GAGCGGAACA 
GGATATGCGG GACAATATCA CAAGGATGTT GCCGGGATTT ATGAGGACAT GGACAAGTGT 
CCTGAGGAGC TTTTGCTATT TTTCCACCAT ATGCCCTACG ACTACATACT AAAATCAGGC 
GAAACGCTGA TTCAATACAT TTACAACACC CATTTCAAAG GGGTTGAGGA GGTAGAAGAA 
TTGAGGAACA AGTGGTTTAG TCTGAAAGGT TGGATTAGCG AGGAAATATT TCTGCACGTT 
CTGGAAAGAT TGGACGGACA GTTGGAACAT TCCAAAGAGT GGAGAGATGT TATAAATACA 
TATTTCTATC GAAAAACAGG TATATCTGAT GAACTTGGCA GAAAAATATA TTAA

Protein sequence

MYKSNVNDEL YGANGYNCWL GYHLLENGEL RENYSQWASN IVISKEPDEI KIALSELKSG 
INGILGVDAV VVTREPEQSS CIALGVLGRG QNIDSYVKYD EVVQIGNEGF IIKAFKTGNS 
EIVVVAGTTT KGLLYGVFSL LRLLQTEATI SGILKIENPA NQLRIINHWD NIDGSIERGY 
AGKSIFFTDN KVTEDLGRIK DYARLLCSVG INSIVINNVN VHKYESMLIT DKYLNDVASL 
AQIFRDYGIK LYLSANFAST IEIGGLATAD PLDPQVRKWW KEKADEIYSL IPDFGGFLIK 
ADSEFRPGPF TYGRTHADGA NMLAEALEPY GGLVIWRCFV YNCMQDWRDR ITDRARAAYD 
NFMPLDGLFR ENVLLQIKNG PMDFQVREPV SPLFGGLQKT NQLLELQITQ EYTGQQKHLC 
YLVPMWKEIL DFDTMAKGRN TSVKKIITGS VFNNKLGGMA AVTNIGNDLN WTGHQMAQSN 
TYGYARLCWN PDLSAEKITD EWVRMTYSNY EKVVNTVKEM LLGSWRTYEN YTSPLGIGWM 
VNPNHHYGPN VDGYEYDKWG TYHRADHKGI GVDRTVKSGT GYAGQYHKDV AGIYEDMDKC 
PEELLLFFHH MPYDYILKSG ETLIQYIYNT HFKGVEEVEE LRNKWFSLKG WISEEIFLHV 
LERLDGQLEH SKEWRDVINT YFYRKTGISD ELGRKIY