Gene Caci_3602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3602
Symbol
ID	8334955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	4021849
End bp	4023153
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	71%
IMG OID	644956744
Product	glycoside hydrolase family 6
Protein accession	YP_003114347
Protein GI	256392783
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0359346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCCA GAACCGCGAG ACTCCTGCTC GCCGCAGGTC TTTCCGCATC GGCCATCGCC 
TTGGGTCCGG TCGCCACGGC GGCCACCGCG ACCACGGCGC ACGCCCCGAG CGCCGGGCAC 
ACGCTGCCGG CCGACACGCG CTTCGCCGTC ACGCCCGACA ACGAGGCCCA GCGCCAAGCA 
CTGACCGATC TGCAGCACCA CGACCTCGCC GGCGCCGCGG CCATGGCGAA GCTGGCCAGC 
TGGCCCGAGG CGACCTGGTT CACCAGCGGC ACGCCGGCTC AGGTGCGCGA CCAGGTCCGC 
GCGACCGTGC GGACCGCCGC GGCCGAGCGT GCCGTTCCGG TGCTGGTCGC CTACGACATC 
CCGCTGCGGG ACTGCAGTCA GTACTCCGCC GGCGGCGCGG CGTCCGATGC CGCCTACCAG 
CAGTGGATAT CAGCGTTCGC ACAAGGGGTC GGCTCGAGCC GGGCCGTGGT GATCGTCGAG 
CCGGACGCGC TGGCGAACCT GCCCTCGGAT TGCAATGCCA CCACCGACCC GACCGGGACG 
CTGACCGCCG GGCGCATCGC CGACATCAAG TACGCGGTGT CCGCCCTCGA AGCCCAGCCG 
CAGACGGTCG TCTACCTCGA CGCCGGAAAC AGCCAGTGGC ACTCTGTCGG CGATATGGCG 
CAGCGCCTGA TCCAGGCAGG CGTCGCTCAG TCCCAGGGCT TCTTCCTCAA CGTGTCCAAC 
TACCAGCCGA CCGACCAGAC CGACCAGTAC GGCACCTGGA TCTCCAAGTG CCTGTGGTTC 
GCCACCGACG GTCCGGCATG GGCAGCCGGA CACACCGACT ACTGCGCCAG CCAGTACTAC 
TCCTCGGCGG CGCCGAACGA CGGAGCGCCC GGCGACGCGG TGTCCCCGAC CGATGCGAGC 
ACCTGGCACT GGACGGACGC CTGGTTCGAC CAGAACGTCG GCACTCCCCC GCCCGCGCAG 
CTGACCCACT TCGTCGTGGA CACCAGCCGC AACGGTAAGG GCGCATGGAC CCCGGCGCCC 
GGCAAGTACA CCGGCGACCC CCAGACCTGG TGCAACCCTC CGGGTCGCGG CATCGGCGCC 
ACGCCGACCG CCGCCACCGG CGTCCCGCTC GTCGACGCCG ACCTGTTCAT CAAGACGATC 
GGCGAGTCCG ACGGCAGCTG CACGCGCAGC ACCGCGGGTC CCGGCGACCC CGAATACGGC 
GGCACGGTGG ACCCGGCGGC CGGCGCGTGG TGGCCGGCCC AGGCACTCGG CCTCGTCCAG 
GACGCCGTCC CGACGCTGAC CTTCAATCCG CGTCTGCTTC CCTGA

Protein sequence

MLSRTARLLL AAGLSASAIA LGPVATAATA TTAHAPSAGH TLPADTRFAV TPDNEAQRQA 
LTDLQHHDLA GAAAMAKLAS WPEATWFTSG TPAQVRDQVR ATVRTAAAER AVPVLVAYDI 
PLRDCSQYSA GGAASDAAYQ QWISAFAQGV GSSRAVVIVE PDALANLPSD CNATTDPTGT 
LTAGRIADIK YAVSALEAQP QTVVYLDAGN SQWHSVGDMA QRLIQAGVAQ SQGFFLNVSN 
YQPTDQTDQY GTWISKCLWF ATDGPAWAAG HTDYCASQYY SSAAPNDGAP GDAVSPTDAS 
TWHWTDAWFD QNVGTPPPAQ LTHFVVDTSR NGKGAWTPAP GKYTGDPQTW CNPPGRGIGA 
TPTAATGVPL VDADLFIKTI GESDGSCTRS TAGPGDPEYG GTVDPAAGAW WPAQALGLVQ 
DAVPTLTFNP RLLP