Gene Ccel_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1670
Symbol
ID	7310414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2012309
End bp	2014105
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	42%
IMG OID	643608598
Product	glycoside hydrolase family 2 TIM barrel
Protein accession	YP_002506001
Protein GI	220929092
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3250] Beta-galactosidase/beta-glucuronidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATATC CTGTTTTAAA TTCATCAAGA ACACTAATTG ACCTTTCCGG CATCTGGAGC 
TTTAAAGCTG ACGACGGAAC AGGCTTCCAG CAGCAATGGT ATGCCAATAA GCTAAAAAAT 
CCTATGACTA TGGCAGTACC AGCTTCCTAT AATGATCAGA AAGAATCTAT AGACCTGCGT 
GATCACTACG GTTATGTATT CTATCAAAGA GAGATAGCTA TTCCAAAGAC TTTGGAGGGA 
CAGCGTATTG TTCTTCGCTT TGGTGCAGTC ACTCATTATG CAAAGGTTTA CCTGAATGGG 
CAGCTTATTA CGGAACATAA AGGCGGTTTT CTGCCCTTCG AAGTTGAGAT TCAAGATAAG 
GTTAAATCTC AAAACAACCT GCTGACTGTT GCTGTAAATA ATGTGGTAGA TTACAGTACT 
CTCCCGGTAG GAAGTGAGGT AGGCGGCAAT ATGCTTGGCG GTGTACTCCC ACCGGTTCCC 
GGTGTCACTC CTAAAAAGCA GAATGCACCG AACTTTGACT TCTTTAATTA TGCCGGAATT 
CATCGCCCTG TCAAGATATA CAGCACACCA AAAAAATTTA TAGAAGATAT TACCATTGTT 
CCTTCCCTTG AGGGAACAAA AGCTTCAGTT TATTATAAAA TTGATACAAT AGGTCAGGGG 
GAAACAACGC TTACGATATA TGATGAAGAG AGAGAAGTTG TTGCTGAGGC TAAAGGAAAT 
GAGGGAACCT TTATTATTGA GAATGTGCAC CTGTGGCAGC CCTTAAACGC TTATCTTTAT 
GCAGCTGAAA TCACCTTTGG TGAGGACCGT TATGAGCAGT CCTTTGGAGT ACGGACTGTC 
GAAGTCAAGG ACAGTCAATT CTTAATTAAC GGTAAGCCCT TCTACTTTAA GGGGTTTGGT 
AAGCATGAGG ATTTTATTGC TCACGGCAGG GGGCTTGATG AAGTATTGAA TGTAAAGGAC 
TTGTCTTTGT TGAGGTGGAT AGGAGCAAAT TCCTTCAGGA CAAGTCACTA TCCCTATTCT 
GAGGAAATGA TGAATCTCTG TGACCGTGAA GGCTTTGTGG TAATAGATGA AACTCCGGCT 
GTTGGTGTCA ATGTCAATTT TGGTGCAATG TCCGGTGGAG GTAAGAGAGA TACCTTTGAG 
GTATTGCATA CCCACCAGCA CCATCATGAT GTGGTTGTAG ACATGATTGA AAGAGACAAA 
AACCATCCCT GCATTGTTAT GTGGTCCATA GCCAATGAGT CCGATACTAC TGCTTTCCCG 
GAAAGCTCCT ATAATTACTA TAAGCCTCTT TATGATTTAG CTCATAAGGT GGACCCGCAG 
AACCGACCAG TGACAATTGT CGGTGTGCAA GGTGAATACA AAACAGACAA AACCCTTCCT 
GCTATGGATG TAATCTGCTT AAACCGCTAT TATGGCTGGT ATATTTACGG CGGCGATCTG 
AATGCGGCAA AGCAGGCTTT GAGCATTGAA TTAGATTACT GGAAAACCAT CGGCAAACCG 
ATTATCTTTA CAGAGTATGG AGCAGATACA GTGGCAGGGC TTCATTTGGC TACACCCACT 
ATGTTTACTG AGGAATATCA GGTAGAATTT TTAAGGGCAA ATCACGAGAT TTTTGATAAA 
TATGACTGCT TTGTAGGTGA GCATGTCTGG AACTTCGCAG ATTTCCAGAC TATTCAAGGA 
ATTATGAGGG TTGAAGGGAA CAAAAAGGGA GCCTTTACTA GGGATAGGCG TCCCAAGCTG 
GCAGCTCATT ATCTTCAAAA CCGCTGGACT CAGATACCGG ATTTCGAGTA TAAGTAA

Protein sequence

MLYPVLNSSR TLIDLSGIWS FKADDGTGFQ QQWYANKLKN PMTMAVPASY NDQKESIDLR 
DHYGYVFYQR EIAIPKTLEG QRIVLRFGAV THYAKVYLNG QLITEHKGGF LPFEVEIQDK 
VKSQNNLLTV AVNNVVDYST LPVGSEVGGN MLGGVLPPVP GVTPKKQNAP NFDFFNYAGI 
HRPVKIYSTP KKFIEDITIV PSLEGTKASV YYKIDTIGQG ETTLTIYDEE REVVAEAKGN 
EGTFIIENVH LWQPLNAYLY AAEITFGEDR YEQSFGVRTV EVKDSQFLIN GKPFYFKGFG 
KHEDFIAHGR GLDEVLNVKD LSLLRWIGAN SFRTSHYPYS EEMMNLCDRE GFVVIDETPA 
VGVNVNFGAM SGGGKRDTFE VLHTHQHHHD VVVDMIERDK NHPCIVMWSI ANESDTTAFP 
ESSYNYYKPL YDLAHKVDPQ NRPVTIVGVQ GEYKTDKTLP AMDVICLNRY YGWYIYGGDL 
NAAKQALSIE LDYWKTIGKP IIFTEYGADT VAGLHLATPT MFTEEYQVEF LRANHEIFDK 
YDCFVGEHVW NFADFQTIQG IMRVEGNKKG AFTRDRRPKL AAHYLQNRWT QIPDFEYK