Gene Acel_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0133
Symbol
ID	4484621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	135878
End bp	137314
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	62%
IMG OID	639728895
Product	beta-galactosidase
Protein accession	YP_871894
Protein GI	117927343
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAAA TCGAAGAGCG CGATCAGGTC GAGAGTCGGC CCACGCTACG GTTCCCTGAC 
CGCTTTGTGT GGGGTGTGGC GACGTCCGCC TACCAAATCG AAGGCGCCGT TGCTGAGGAC 
GGGCGCGGTC CGTCGATTTG GGATACGTTC AGCCACACGC CGGGAAAGGT GGTCGGCGGC 
GATACCGGAG ATGTCGCCGC CGACCACTAC CACCGTTACG TCGGCGACGT CCGGTTGATG 
GCGGACCTCG GGGTCACGTC CTACCGGTTC TCGGTGGCGT GGCCGCGTAT CCTGCCCAGC 
GGCTCCGGTG CGGTCAATCG AGCCGGACTC GATTTCTACT CCCGTCTGGT CGATGAGCTG 
CTGAACCACG GCATCACGCC TGCACTGACG CTTTACCACT GGGACCTCCC GCAGGCGTTG 
CAAGACCAGG GCGGGTGGAC GAATCGTGCA ACTGCACAGC GATTCGCTGA ATATGCGGTC 
GTCGTCGCCC GCGAATTGGG TGATCGGGTG AATTTCTGGA TTACTCTCAA CGAGCCGTGG 
TGCGCGGCGT TCCTCGGTTA CGGGGCGGGC GTTCATGCAC CCGGACACAC CGACAGTGCG 
GAAGCCTTGA CGGCGGCGCA TCACCTGCTC CTTGCGCACG GCCTGGCAGT CCAGGCCCTG 
GGCTCGGTTC TGCCGCCGGA TTGCCAGATG GCGATCACGT TGAATCCAGC GGTCGCGCGA 
CCGGCGAGCC TCGCCGAGGA AGATGTGGCC GCCGCCCGGA AGGTCGACGG ATTACAGAAT 
CGGCTCTGGC TGGATCCGCT GTTTCACGGC ACCTATCCGC AGGATGTGGT GAATTTCACG 
TCAAAAGTCA CCGACTGGTC GTTCGTCCGT GACAACGACC TCGCAGTGAT TGCGACCCCC 
TTCGACATTC TGGGGGTCAA TTACTATAAC CCGGTCATCG TCGGTCACTA TGCCGGCTCC 
GGATCGAGGG GACGCGACGG CCACGGTCAG GGAACCGGTG AGACCTGGCC CGGGTGCCCC 
GATATTCAGT TTCCCGAGTG GCCGTTCCGG CGGACCGCGA TGGGCTGGCC CATTGACCCC 
TCCGGACTCT ACGAACTCCT CATTCGGCTG AACCGCGACT ATCCACGGCC GATCATGATT 
ACTGAGAATG GCGCCGCGTT CGATGATGTC GTCACGGACA ACAATCGGGT GCGGGATCCG 
GCACGGGCGG CGTACATCCA GGAACATCTT GCCGCCCTCC ACCAAGCGAT TGCCGACGGC 
GTGGACGTTC GCGGTTATTA CCTCTGGTCA TTGATCGACA ACTTTGAATG GGCGTACGGA 
TACTCACGCC GGTTCGGCAT CGTTTATGTC GATTTCGAGA CTCAGGAGCG GATCATCAAG 
GACAGTGGGT ATTTCTACTC GCTGGTCGCA CGGACGAACA CGATCGCGGC GCCCTGA

Protein sequence

MTQIEERDQV ESRPTLRFPD RFVWGVATSA YQIEGAVAED GRGPSIWDTF SHTPGKVVGG 
DTGDVAADHY HRYVGDVRLM ADLGVTSYRF SVAWPRILPS GSGAVNRAGL DFYSRLVDEL 
LNHGITPALT LYHWDLPQAL QDQGGWTNRA TAQRFAEYAV VVARELGDRV NFWITLNEPW 
CAAFLGYGAG VHAPGHTDSA EALTAAHHLL LAHGLAVQAL GSVLPPDCQM AITLNPAVAR 
PASLAEEDVA AARKVDGLQN RLWLDPLFHG TYPQDVVNFT SKVTDWSFVR DNDLAVIATP 
FDILGVNYYN PVIVGHYAGS GSRGRDGHGQ GTGETWPGCP DIQFPEWPFR RTAMGWPIDP 
SGLYELLIRL NRDYPRPIMI TENGAAFDDV VTDNNRVRDP ARAAYIQEHL AALHQAIADG 
VDVRGYYLWS LIDNFEWAYG YSRRFGIVYV DFETQERIIK DSGYFYSLVA RTNTIAAP