Gene Caci_3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3167
Symbol
ID	8334520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3496455
End bp	3497771
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	70%
IMG OID	644956313
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003113916
Protein GI	256392352
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.000252076
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGATG CTGGGATGCG GAGCGGACGG GGCAAGAAGA CCGGCGGCGT GGCGGCGGTG 
ACGCTGGTCG CGGCGGTGGG GTTGCTGAGC GGGGCGTGCT CCAGCGGCGC GTCGAAGCCG 
GCGGCGCAGG GGAGTTCGAG CTCGTCGTCC ACGACGACTT CGTCGACACC GACGACGACG 
TCTTCGTCCT CGACACCGAC GACTACTTCG TCGTCGAGCT CCTCGTCGTC CTCGGCGCCG 
TCTTCGTCGT CGAGCTCGAC GACCCCGAAG CCGCCGACGA CTCCGTCCAG CTCGCCCGCG 
GCGCCCGGGA ACCTGACGCT GCAGCAGGAG GCCGGGCAGC GGGTCATCTA CTCCTACCAG 
GGCCTGACCC CGCCGCAGCA TCTGCTGACC CTGATCCGGC AGGGCGACGT CGGCGGCGTC 
ATCTTCTTCG GCGGCAACAT CTCCAGCCAG TCGCAGATCG CCGGCGTCAT CACCGAGCTG 
CGCCAGGCGC AGGCGGCCAG CCCGGTCCAC CTGCCGCTGC TGCTGATGAC CGACCAGGAG 
GGCGGCATCG TCAAGCGCCT GCCCGGACCG CCGTACGACT CGGCGAAGCA GGTCGGCCAG 
AGCTCGAACC CCCCCGGCGC GGCAACCGCC CAAGGCACCG CAGCCGGACA GAACATGGCG 
GGCGTCGGCA TGAACCTGAA CCTCGCGCCG GTCCTGGACG TCTACCGCAC CCCAGGCAAC 
TTCCTCGACG CCGCCCAGCG CTCCTTCAGC CAGAACCCGA ACACAGTCTC GCAGCTGGGC 
TCGAACTTCA TCGTGGCCCA GCAGAACACC GGCGTAGCCG CCACCGCCAA GCACTTCCCC 
GGCCTCGGCT CCGCACCCAA CGGCGCCAAC ACCGACGAGC ACCCGGTGAC CCTCACCGTG 
TCCCTGAGCA ACCTGCGCAG CATCGACGAA CTGCCCTACG CCGCAGCAGT GCAGAACGGC 
CTGAAACTGG TGATGATGTC CTGGGCGATC TACCCGGCCC TAGACGCCAA CCGCCCGGCA 
GGCATGTCCT CCACAATCGT CCAGCAGGAA CTACGCGACC GCGTCGGCTT CAAGGGCGTG 
ACCATCACCG ACGCGCTGGA AGCCGGCGCG CTGCAGGCGT ACGGCACCGC GGGCAACCGC 
GCCCTGTCGG CAGCGGAGGC AGGCATGGAC CTCCTGCTGT GCTCCTCCGG CGACCCGGCG 
CAGGGCGACG CCGCGGCAGC AGCACTCGTG GCCGCCGTGA ACAACGGGAA GCTGAGCCGG 
AGCGGGTTCG ACGCGGCGGT GGGGCGGGTC GACGCGCTGC GGGGTGGGTT GAAGTAG

Protein sequence

MADAGMRSGR GKKTGGVAAV TLVAAVGLLS GACSSGASKP AAQGSSSSSS TTTSSTPTTT 
SSSSTPTTTS SSSSSSSSAP SSSSSSTTPK PPTTPSSSPA APGNLTLQQE AGQRVIYSYQ 
GLTPPQHLLT LIRQGDVGGV IFFGGNISSQ SQIAGVITEL RQAQAASPVH LPLLLMTDQE 
GGIVKRLPGP PYDSAKQVGQ SSNPPGAATA QGTAAGQNMA GVGMNLNLAP VLDVYRTPGN 
FLDAAQRSFS QNPNTVSQLG SNFIVAQQNT GVAATAKHFP GLGSAPNGAN TDEHPVTLTV 
SLSNLRSIDE LPYAAAVQNG LKLVMMSWAI YPALDANRPA GMSSTIVQQE LRDRVGFKGV 
TITDALEAGA LQAYGTAGNR ALSAAEAGMD LLLCSSGDPA QGDAAAAALV AAVNNGKLSR 
SGFDAAVGRV DALRGGLK