Gene Caci_4947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4947
Symbol
ID	8336301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5648321
End bp	5650255
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	70%
IMG OID	644958046
Product	Alpha-L-fucosidase
Protein accession	YP_003115648
Protein GI	256394084
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3669] Alpha-L-fucosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00851313
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACC CTGTGTCCCG ACGCGCCGTG CTGTCCGGCA CGGCGGCGGC AATAGCCGCC 
ACGAGTCTCA CCGCCGGCGG CGAGAGCCCT GCCGCCGCCG TACAAACCGC TGCCGCGCAA 
GCCAATCCGC TGGTACCCCT CCGGATCCCG AAGCTGGACC AGGGCATGTG GCAGCAGCCC 
GACGCGACCA TCCAGTGGCT GCGCGACACC CGGCTGGGCA TGTTCATCCA CTGGGGCGTC 
TACGCCGGCC CGGCACACGG CGAGTGGTAC ATGCACTCGG CCGCGATCAC TCCGGCTGCC 
TACCAGAACT TCGTCACGCA GTCCTCGCCG CAGCAGTTCA CCGCCGACGC CTACAAGCCC 
TCCGACTGGG CCGCCCTGGC CAAGCAGCTC GGCGCCGGCT ACACCGTGCT GACCGCCCGA 
CACCACGACG GCTTCGCGCT GTGGCCCAGC ACCTACCCCG CCGGCTGGAA CGCCGGACAG 
GCACCGCTGA AGCGCGATTT CGTCAAGGAC TACGTCGCTG CGGTCCGCGC GGCAGGTCTG 
CGGGTCGGCC TGTACTACTC CCCGATCAAC TGGCGCTACC CCGGCTACTA CGACGTCACC 
GGTACCAACT GCGCACCCAA CCCGTGGGGC TACACCACCG ACCCGGCGCA CCACGAGAAC 
GCGCGCCTGA TGAAGGAGGA GGTCTATCAG TGCGTCAAGG AACTGGTGAC CCAGTACGGC 
GCGCTCGACG ACATCTGGTG GGACGGCGGC TGGCTGGCCG AGCAGGGCAG CGACGCCGAC 
GCGTCGTTCT TCTGGGAGCC GGGCCGCTAC CGGGACTCCG GTAACGGCTG GCAGGTGGAC 
GCCGCCTACG GCGCCACCGA GACCGGCACC GGACTGCCGC TGGGACTCGC CGGCCTGGTG 
CGCCAGAGCC AGCCGACGGC GCTGGCCTCG CCCCGGTCGG GCTGGGTCGG CGACTACGAC 
GTCGACGAGG GCGGCTCCGT GCCCGCCGGC CGCCTGCGGT CCGGCCACCT GGTGCAGAAG 
ACGTTCAGCG TCGGCAGCAC CTGGGGCTAC AACTCCGACG GCGCCGTGAT GAGCCACGCC 
TCGGCCATGG CCTTGCTGGT CAACAGTTTC ATCCGGGACA TGTGTGTGCT GATCAACGTG 
GGACCGGACC GCCACGGTAC CGTCCCGGCG AATCAGGCCG CCCTCATGCA ACAGCTGGGC 
ACGTTCATGA AAGCCAACGG CGAAGCGGTC TACAACACCC GCGGCGGACC ATGGGACCCG 
GTGGACGGCC AGTACGGCTT CACCTTCAGC GGACAGACCG TCTACGTCCA TCTCCTGCCC 
GGCTACTCCG GAAGCAGCTT CACCACGCCG GCACTGGGCG ATGCCCGCGC CGTCCGAGCC 
TACGACGTGG TCTCACACGC CCCGCTCACC CTCGGTACCG GTTCCGGAAA CCAGGCCACG 
ATCAGCGGTA TCGACCGCAC CCGCTACCCG GACGACACCG TCGTCGCGCT CGTCCTGGAC 
CGGACGGTCG TCCCCGCCGA CATCGCCCTG GGCCGCACCG CCGGCGCGGA CAGCGTCGAG 
ACCGCCCACG GCAACCTCGC CTCCCACGCC GTGGACGGCG ACACCTCCAC CCGCTGGTGT 
GCGAGCGACG GTGCCGCCGG CCACTGGCTG ACCGTGGACC TCGGCGGCGT CCACACCGTC 
ACCGGGGCGC GCGTCGCCTG GGAATTCGGT GGACACCGGT ACGGGTACCG GATCGACGGC 
TCCACCGACG GCACGTCCTG GACGACGCTT TCCGACCAGA GCGCGACCGG CAGCACCTCC 
CAAGTCCAGA CCGTCGCCTT CACCGCGGCC ACGCGCCACC TGCGGATCAC CGTCACCGCC 
CTGGACGCCG GCTGCTGGGC TTCGATCCGT TCCTTCGAGG TCTACGACCG GGCCTTCTAC 
GATCCTTCGC TGTAG

Protein sequence

MTNPVSRRAV LSGTAAAIAA TSLTAGGESP AAAVQTAAAQ ANPLVPLRIP KLDQGMWQQP 
DATIQWLRDT RLGMFIHWGV YAGPAHGEWY MHSAAITPAA YQNFVTQSSP QQFTADAYKP 
SDWAALAKQL GAGYTVLTAR HHDGFALWPS TYPAGWNAGQ APLKRDFVKD YVAAVRAAGL 
RVGLYYSPIN WRYPGYYDVT GTNCAPNPWG YTTDPAHHEN ARLMKEEVYQ CVKELVTQYG 
ALDDIWWDGG WLAEQGSDAD ASFFWEPGRY RDSGNGWQVD AAYGATETGT GLPLGLAGLV 
RQSQPTALAS PRSGWVGDYD VDEGGSVPAG RLRSGHLVQK TFSVGSTWGY NSDGAVMSHA 
SAMALLVNSF IRDMCVLINV GPDRHGTVPA NQAALMQQLG TFMKANGEAV YNTRGGPWDP 
VDGQYGFTFS GQTVYVHLLP GYSGSSFTTP ALGDARAVRA YDVVSHAPLT LGTGSGNQAT 
ISGIDRTRYP DDTVVALVLD RTVVPADIAL GRTAGADSVE TAHGNLASHA VDGDTSTRWC 
ASDGAAGHWL TVDLGGVHTV TGARVAWEFG GHRYGYRIDG STDGTSWTTL SDQSATGSTS 
QVQTVAFTAA TRHLRITVTA LDAGCWASIR SFEVYDRAFY DPSL