Gene Caci_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1004
Symbol
ID	8332338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1144384
End bp	1145400
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	67%
IMG OID	644954153
Product	polysaccharide deacetylase
Protein accession	YP_003111773
Protein GI	256390209
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.794794
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.121632
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTACG AGGACCAGGA CCTCCCCATA GGCTGCGGCT GCGAAGACCA CGACCTGACA 
CCGACACCGG ACGCGAGCCC GGCGCACGCC TCTCGACGAC GCTTTCTCCG TTCCGCCGCA 
GGGCTCGCCG TAGCCGCGCC GGCCATGCTG GCCGCGGCTT GCGGCTCCGG CAGTTCATCC 
TCGGGAGCGA AGCAGAACGC CGGAGCCGGC GTGACTCCCA CCTCGGGCGC CTCCACGTCG 
GGCGCGCCCT CGCAGTCCTC CAGCTCGCCG TCCGGCGCCG CGAGTAGCAG CGGCAACGGT 
CTCCCCGGTC CCGAGACCGC GGACGCGGCA CTCCTGGCGC ACCGCTACGA CGGACTCAAG 
CCCTTCGCCC CGGCTCCGCC GCCGCCCGCG ACCAAGCCGG TGAACACGAA CGTCGACCTC 
CCCCCGGTCA TCAGCCACAT CCCGACGGAC CAGAAGATCT GCTTCCTCAC CATCGACGAC 
GGCGCCGAGA AGGACCCGGC CTTCATCCAG ATGGTCAAGG ACTTCCGCAT CCCCATCACG 
ATGTTCCTGG CCGACATGTT CATCCAGGAC GACTACTCGT ACTTCACAAA GCTCCGCGAC 
ACCGGCTACT GCACCATCCA GAACCACACC CTGCACCACC CGGACATGAC GACCCTGAGC 
GCCGAGCGCC AGCTGGCAGA GGTCACCGGC CAGCAGCAGA AGCTCGTCAA GAACTACAAC 
ACCCACCCCT ACCTGTTCCG CGCGCCCTTC GGGAACTCCA ACAAGGCGAC GCAGCAAGCC 
TGTAAGCAGA ACGGCCTCAA GGCCATCTGC TACTGGCGCG CGACGTTCCA GAAGCAGGGC 
TTCCAGTGGC AGGCGGCCGA CAAGAAGCTC CGCCCCGGCG ACATCCTGCT GGCGCACTTC 
CGCGGTCCCA AGGCCAACGG CAAGGGCTGG CCGGAGATGC ACGAGCTGAT GACCAACCTG 
TTCCGCATCG TGCAGGAGCA GGGGTACACG TTCGCTCGGC TGGAGGACTA CGTCTGA

Protein sequence

MTYEDQDLPI GCGCEDHDLT PTPDASPAHA SRRRFLRSAA GLAVAAPAML AAACGSGSSS 
SGAKQNAGAG VTPTSGASTS GAPSQSSSSP SGAASSSGNG LPGPETADAA LLAHRYDGLK 
PFAPAPPPPA TKPVNTNVDL PPVISHIPTD QKICFLTIDD GAEKDPAFIQ MVKDFRIPIT 
MFLADMFIQD DYSYFTKLRD TGYCTIQNHT LHHPDMTTLS AERQLAEVTG QQQKLVKNYN 
THPYLFRAPF GNSNKATQQA CKQNGLKAIC YWRATFQKQG FQWQAADKKL RPGDILLAHF 
RGPKANGKGW PEMHELMTNL FRIVQEQGYT FARLEDYV