Gene Cthe_0625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0625
Symbol
ID	4808227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	770401
End bp	772533
Gene Length	2133 bp
Protein Length	710 aa
Translation table	11
GC content	44%
IMG OID	640106039
Product	glycoside hydrolase family protein
Protein accession	YP_001037053
Protein GI	125973143
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAAAA AGACATTATG CTTTGTACTG ACTTTGGCTA TGCTGACGGC ATTTATTCTT 
CCTCAGGGGA TTGTGTCCGC AGCAGGAAGC TATAACTATG CGGAAGCACT TCAGAAAGCC 
ATTTACTTTT ATGAGTGTCA GCAGGCCGGC CCTCTACCTG AATGGAACCG CGTTGAGTGG 
CGTGGCGACG CAACAATGAA TGATGAGGTA CTTGGTGGAT GGTATGACGC AGGTGACCAT 
GTCAAGTTTA ATCTGCCTAT GGCGTATTCG GCGGCAATGC TTGGCTGGGC TCTTTATGAG 
TATGGCGATG ACATTGAGGC ATCGGGGCAG AGACTTCATC TTGAAAGGAA CCTTGCCTTT 
GCCCTTGACT ATCTTGTTGC CTGCGACAGA GGTGACAGTG TCGTTTATCA GATAGGTGAC 
GGTGCCGCTG ACCATAAATG GTGGGGTTCT GCGGAAGTTA TTGAAAAAGA AATGACAAGA 
CCTTACTTTG TAGGAAAGGG ATCCGCCGTT GTAGGTCAGA TGGCTGCAGC TTTGGCTGTA 
GGTTCCATAG TTCTTAAAAA TGATACATAC CTCAGATATG CGAAGAAGTA TTTCGAACTT 
GCAGATGCAA CAAGAAGTGA CAGCACTTAT ACTGCTGCAA ATGGTTTCTA CAGTTCCCAC 
AGCGGATTCT GGGATGAGCT GTTGTGGGCT TCCACTTGGC TCTATCTTGC AACAGGTGAT 
AGAAATTATC TTGATAAAGC TGAGTCCTAT ATTCCAAAAT TAAACCGTCA GAATCAGACC 
ACAGATATAG AATATCAGTG GGCACATTGC TGGGATGACT GCCACTATGG AGCAATGATC 
TTGCTTGCAA GAGCTACAGG TAAAGAAGAG TATCACAAAT TTGCACAAAT GCATCTGGAT 
TGGTGGACAC CTCAAGGTTA TAACGGAAAG AGAGTTGCAT ATACTCCCGG CGGACTTGCG 
CATCTTGATA CCTGGGGACC GTTGAGATAT GCTACAACTG AAGCATTCCT CGCTTTTGTA 
TATGCCGATT CAATAAATGA CCCGGCTCTC AAGCAAAAAT ATTATAATTT TGCGAAAAGC 
CAGATTGACT ATGCATTGGG TTCAAATCCT GACAACAGAA GCTATGTAGT CGGATTTGGA 
AACAATCCGC CACAGCGTCC TCACCACAGA ACCGCTCATG GAACTTGGTT GGATAAAAGA 
GATATTCCGG AAAAGCACAG ACATGTACTT TACGGTGCTC TGGTCGGAGG ACCCGGAAGA 
GATGACAGTT ATGAAGACAA TATAGAGGAT TATGTAAAAA ATGAAGTTGC CTGCGACTAC 
AATGCAGGTT TTGTAGGCGC GCTCTGCAGA TTGACTGCTG AATACGGCGG AACTCCTCTT 
GCGAACTTCC CGCCACCGGA ACAAAGAGAT GATGAGTTCT TCGTAGAAGC GGCTATAAAT 
CAGGCAAGTG ATCATTTCAC TGAAATAAAA GCATTGCTCA ACAACCGTTC ATCCTGGCCG 
GCAAGACTTA TTAAGGACCT TTCATACAAC TATTATATGG ATTTGACTGA AGTTTTTGAG 
GCAGGTTACA GTGTTGACGA TATTAAAGTA ACAATAGGCT ATTGCGAAAG CGGTATGGAT 
GTCGAGATTT CGCCGATTAC TCATTTGTAT GACAATATTT ATTACATAAA AATATCATAT 
ATCGACGGAA CCAATATTTG TCCGATAGGT CAGGAACAGT ATGCCGCTGA GCTTCAGTTC 
CGTATTGCGG CACCTCAAGG TACTAAATTC TGGGATCCGA CAAATGACTT CTCATATCAG 
GGACTTACCA GAGAGTTGGC AAAGACAAAA TATATGCCCG TTTTTGACGG AGCAACAAAA 
ATCTTTGGAG AAGTTCCAGG CGGCTTTGAA CCGGTTCCTT CACCTTCGCC GACTCCTGCT 
CAATATAAAG TCGGTGACTT AAACGGTGAC GGAGTGGTTA ATTCAACTGA CAGTGTAATA 
TTGAAAAGAC ATATAATTAA ATTTTCTGAA ATAACAGATC CAGTTAAATT GAAAGCTGCT 
GATCTTAACG GAGATGGCAA TATAAACTCC AGCGATGTTT CATTAATGAA GAGATATCTG 
CTCCGTATAA TAGATAAATT TCCGGTAGAA TAG

Protein sequence

MVKKTLCFVL TLAMLTAFIL PQGIVSAAGS YNYAEALQKA IYFYECQQAG PLPEWNRVEW 
RGDATMNDEV LGGWYDAGDH VKFNLPMAYS AAMLGWALYE YGDDIEASGQ RLHLERNLAF 
ALDYLVACDR GDSVVYQIGD GAADHKWWGS AEVIEKEMTR PYFVGKGSAV VGQMAAALAV 
GSIVLKNDTY LRYAKKYFEL ADATRSDSTY TAANGFYSSH SGFWDELLWA STWLYLATGD 
RNYLDKAESY IPKLNRQNQT TDIEYQWAHC WDDCHYGAMI LLARATGKEE YHKFAQMHLD 
WWTPQGYNGK RVAYTPGGLA HLDTWGPLRY ATTEAFLAFV YADSINDPAL KQKYYNFAKS 
QIDYALGSNP DNRSYVVGFG NNPPQRPHHR TAHGTWLDKR DIPEKHRHVL YGALVGGPGR 
DDSYEDNIED YVKNEVACDY NAGFVGALCR LTAEYGGTPL ANFPPPEQRD DEFFVEAAIN 
QASDHFTEIK ALLNNRSSWP ARLIKDLSYN YYMDLTEVFE AGYSVDDIKV TIGYCESGMD 
VEISPITHLY DNIYYIKISY IDGTNICPIG QEQYAAELQF RIAAPQGTKF WDPTNDFSYQ 
GLTRELAKTK YMPVFDGATK IFGEVPGGFE PVPSPSPTPA QYKVGDLNGD GVVNSTDSVI 
LKRHIIKFSE ITDPVKLKAA DLNGDGNINS SDVSLMKRYL LRIIDKFPVE