Gene Caci_3822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3822
Symbol
ID	8335175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4323531
End bp	4325087
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	71%
IMG OID	644956961
Product	Xylan 1,4-beta-xylosidase
Protein accession	YP_003114564
Protein GI	256393000
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3664] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.163293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.112071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGATC CCATCATCGT CCCGGAGCGG TCCGCCGGCC GGCTGAGCCA GGCCTGGCGG 
CAGTGCGTCG GCACGGGTCG GTTCGAGCTG GCGCTGCGCC GCGACTACCA GGACTCGCTG 
GCGCTCATCC AGCGGGAGGT CGGCTTCCGG CACATCCGGG GCCATGGCCT GTTCAGCGAC 
GGCGTCGGCG TGTACCAGCC GTACCGGTAT CAGGGCTCCG ATCACGTCCG CTACGCGTTC 
GGGTACGTGG ACCAGGTCAT CGACGCCTAC CTCGACCTCG GGATCCAGCC CTTCCTGGAA 
CTCGGGTTCA TGCCCTCGGC GCTGGCCTCG GGCGACCAGA CGGTGTTCTG GTGGAAGGGC 
AACGTCACTC CCGCGCGGTC CTGGAGCGCG TGGGCGGACC TGGTGCGGGC CACCCTGAGG 
CACCTCGTCG ACCGGTACGG CCTCGACGTG GTGCGCCAGT GGCCGATCGA GGTCTGGAAC 
GAGCCGAACC TGAAGGACTT CTGGCAGGGA GCGGACCGGG AGGCGTACCA CCGGCTGTAC 
GAGGTGACGG CGCGGGCGGT GAAAGAGGTG GACGCCGCCC TGCAAGTGGG CGGTCCGGCC 
ATCTCTCCCG GCGCGGACGA GTGGCTGGCG CCGTTCGCGG AGTTCGTCAC GGCACGCTCG 
GTGCCCGTGG ACTTCGTCAG CCGGCACGCC TACACCTCGG GTCCGGCCCA GCACGTCCCC 
TTCGGCGTGC ACCAGAGGCT GCTTCCGGCG CGGCATCTGC TCGAACAGTT CGCCGCGCCG 
CGCGAGCACC TGCGCGGCAC GGCGCTGGCC GGGCTGCCGG TACACATCAC CGAGTTCAAC 
TCCTCCTACC GGCCCGACAA TCCCGTGCAC GACACCGCGT TCCACGCCGC TTACCTCGCC 
CCGGTGCTGG CCGAGGGCGG CGACCACGTG GATTCCTTCT CCTACTGGAC GTTCAGCGAC 
ATGTTCGAGG AGGCGGGGGT TCCGACCTCG CTGTTCCACG GCGGATTCGG GCTCCTGACC 
CACCGCCAGA TCAAGAAGCC CGCCTTCCAT CTGTACGCGT TCATGGCGCG CATGGGCGAA 
GAAGTGCTGG CGCGCGGCGA GGACCATCTG GTCTGCCGCC GCCCGGACGG CACCGTGACG 
GTGCTGGCCT GGGCTCCGGT GGAGGTCGCC GGCCGCGAGC CGGCGGCGGC CGGACATCGG 
CTGCGCTTGT CGGTCCCGAT CGGGACGGCG GCGCGCTCGG CCTTCGCTTT GCGCTCCTCG 
GTCAGCGAGG ACGCGGGCAA CGCGTGGGCG GCGTGGAGCG AACTCGGGCG GCCCGCGTCG 
CCGACCGAGC GGCAACTCAG TGTTCTCCGT GAGACCGCCG AACCGTCGCG ACGGCACGAA 
GCCCTCCCCG TCGCGGGCAG CCGCGTCGAC CTCGACCTGG TGCTGGACCG CCATGAGGTG 
ACGCTGATCG AGATCAGTGC CGTGCACGAC CAGACGCCAC CGTGGTGGGA CGAGCGGCGG 
CTGGTCGGGT TGCCCGGCGA CAGCGACAGC AACTACGAGA CGGAGGACGC CCGATGA

Protein sequence

MPDPIIVPER SAGRLSQAWR QCVGTGRFEL ALRRDYQDSL ALIQREVGFR HIRGHGLFSD 
GVGVYQPYRY QGSDHVRYAF GYVDQVIDAY LDLGIQPFLE LGFMPSALAS GDQTVFWWKG 
NVTPARSWSA WADLVRATLR HLVDRYGLDV VRQWPIEVWN EPNLKDFWQG ADREAYHRLY 
EVTARAVKEV DAALQVGGPA ISPGADEWLA PFAEFVTARS VPVDFVSRHA YTSGPAQHVP 
FGVHQRLLPA RHLLEQFAAP REHLRGTALA GLPVHITEFN SSYRPDNPVH DTAFHAAYLA 
PVLAEGGDHV DSFSYWTFSD MFEEAGVPTS LFHGGFGLLT HRQIKKPAFH LYAFMARMGE 
EVLARGEDHL VCRRPDGTVT VLAWAPVEVA GREPAAAGHR LRLSVPIGTA ARSAFALRSS 
VSEDAGNAWA AWSELGRPAS PTERQLSVLR ETAEPSRRHE ALPVAGSRVD LDLVLDRHEV 
TLIEISAVHD QTPPWWDERR LVGLPGDSDS NYETEDAR