Gene Acel_0128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0128
Symbol
ID	4484616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	129121
End bp	130548
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	66%
IMG OID	639728890
Product	glycoside hydrolase family 3 protein
Protein accession	YP_871889
Protein GI	117927338
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.174382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTCG TTCAGCTCGT CAATAGCTGC CTGTTGCCCG GCTTTGCCGG TGGTGACCAG 
TTACCGGACT GGGTACGCCG GGCGCTCGAC CAGGGACTCG CCGGCGTGGC GATTTACGGG 
CACAACCTCG TGGACGACGG GTCGGTCGCC CGCATTGCGC AGGCCGTTCA CAACACCGCG 
CCGGATGCAC TGGTTGCCCT CGACGAAGAA GGCGGCGACG TCACCCGACT CGAATATCGG 
ACGGGTAGCT CCTACCCGGG CAATTTGGCG CTCGGCGTGG TGGACGACCT CGAACTGACG 
GCACGTGTCG CGGCGGCGAT CGCAGCGGAT CTCGTTGCCG CAGGAGTGAA TTACAACCTG 
GCGCCGGCCG TCGACGTGAA TAGCGATCCG CGAAATCCAG TCATCGGCGT CCGGTCGTTC 
GGCGCTGATC CCGACAAGGT GGCGGCGCAC GGTGCGACGT TCATCACCGC CATGCAGTCT 
CGGGGAATTG CAACCGCAGC GAAGCATTTT CCGGGACACG GCGCCACCGT TGCCGATTCG 
CACCACACGC TGCCAGTGAT CGACGTCGAT GAACCGACCT TTCGACGGCG GGATTTGCCG 
CCGTTCGTCG CGGCGATCCA AGCCGGCGCA GCGAGCATCA TGACGTCACA CGTTGTCTTT 
ACCGCGCTCG ACGCTGATCT CCCGGCCACT CTCAGTCCAC GCCTGCTGCG CGGCCTGCTT 
CGCAGTGAAC TCGGCTATTC CGGCGTCGTC GTGACCGATG CGCTCGACAT GCGAGCCGTC 
GCCGATACGT GGGGAATAGC CGGTGCGGCG GTTCGTGCGC TTGCTGCGGG TGCGGACCTG 
CTTCTTGTCG GCGCTGTGGA CGGCGAGCGC TACTGCGCCG AGATTCACGC TGCGGTAACC 
GACGCGATTG CGGCTGGTGA TCTGACCGTG GAGACGTTGG AGGCAGCCGC CGCGCGCATC 
CGAGCGCTGC GGGAATTCGC AGCTGTTCGT CGCGGAGATT CTCGTCGTGC GGATGGCCGT 
GGCGGGCGTG ACAGCGGCCT TCTCGCTGCA CGACGCGCCC TCCAGGTGCG CGGCGACGTG 
CACATTGCGG AACCAGCTGT CGTCGTCGAG TTACGGGCTG CCGCCAATCC TGCCGTGGGT 
GAGGCGTATT GGAGTCTTGC TGACGCCCTC GACAGATTTG GCCTCCTTGC GGAACGCATC 
GCTGTTCATG ACGGAAGTCC GCATGCGGAC GAGATAGCGG CCCGCGCCCA GGGACGTCCG 
CGGTGGTCGT CGCGGTCCGC GACGCCTATC GGAGTGCGTG GCAGCGCGAC TGGGTGCGCG 
CTTTTTTCGG CGGGCGTCCG GACGCTGTAC TGGTGGCCGT CGGAATGCCG AATGATGCGG 
AACTCTCTAA CGGGCGTGTC CTGCTTACCT TCGGCGCAGG CCTGGTGA

Protein sequence

MDVVQLVNSC LLPGFAGGDQ LPDWVRRALD QGLAGVAIYG HNLVDDGSVA RIAQAVHNTA 
PDALVALDEE GGDVTRLEYR TGSSYPGNLA LGVVDDLELT ARVAAAIAAD LVAAGVNYNL 
APAVDVNSDP RNPVIGVRSF GADPDKVAAH GATFITAMQS RGIATAAKHF PGHGATVADS 
HHTLPVIDVD EPTFRRRDLP PFVAAIQAGA ASIMTSHVVF TALDADLPAT LSPRLLRGLL 
RSELGYSGVV VTDALDMRAV ADTWGIAGAA VRALAAGADL LLVGAVDGER YCAEIHAAVT 
DAIAAGDLTV ETLEAAAARI RALREFAAVR RGDSRRADGR GGRDSGLLAA RRALQVRGDV 
HIAEPAVVVE LRAAANPAVG EAYWSLADAL DRFGLLAERI AVHDGSPHAD EIAARAQGRP 
RWSSRSATPI GVRGSATGCA LFSAGVRTLY WWPSECRMMR NSLTGVSCLP SAQAW