Gene Caci_5002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5002
Symbol
ID	8336356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5726282
End bp	5727586
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	71%
IMG OID	644958101
Product	Carbohydrate binding family 6
Protein accession	YP_003115703
Protein GI	256394139
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.173534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.970629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGAC CACTGCTGTC CCGTCTGATA CCTGCTGTGG TGCTCGTCGT CGCCACGACG 
GGTGCCGTGG CCGGTCAGAG CGCTGCGAAG GCCGCCGGCG TGGTACCGGG GTTGACCGGA 
GCGGCGGCGC GACAGGCCGC CGGTCCCGCG GCCGATCGGT TCCGGCAGCT CACCGAGCAG 
CGCGTCCAGG CGGCTGCGGC CGGGCACGGC GCGGCTTCGT CCGCGGCCGC CACGCTGCAC 
ACCAGCTGGG GCATCACGAT GCCGGTCGGC GTCGGCACCG GTTTCAAAGC CCTGCAAAGC 
GTGGTCGGCG GAGCCCAGCC GACGAACGGC GGCGACTTCG TCTACGCCCC GACGGCGCTG 
CCGCCCGGCC GCGCGTGCAT GGAGATCACC ACCGCCTACA CGCCCAGCGG CCCGGATCTG 
TGGGCCTGGG ACTGGTGCGG CGGACGCGAT CAGGTCGGCA AGCTCACGGC GATGGACTCG 
ACCTTCCTGG CCACCTACAC CACCACGGTC AACGGTCACC CCGCCTACGA CCTCGACGAG 
CACCAGACCT CGGCCTCGGG CAACGTCTGG ACCGCGTACC TGTACAACTA CCAGACCCAC 
GCCTGGGACA CCTTCTACAC CAGCTCCGGT ACCTACGACC TGTCGCAGTA CCCCTTCGGC 
TGGGACATGT TCGAGGTCTA CACCACCCCC GATCCGGGCA CCGGCGCCGG CTACTACTGC 
CACGACCTGC TCGGCAAGCC CTTCGAGAGC AGCAGCGTCC AGCTCCTGAC CGGCAGCACC 
TGGACTCCCG CGGCGCCCGG CAACAGTTCC CCCGACAGCA CGCCGCCCGC ACCCGGCAGC 
AGCCTGGACT GTCCCGCCCT GACCATCACC CTGGCCCACC CGAACGACGA CTGGACCGCC 
CTGATCGGCG GCACCAGTGG CAGCTCGCAG TCCTACGAAG CCGAAGCCGC CGGCAACACG 
CTGGCCGGTC AGGCCGCGGT CCGCAGCTCC TCCGGCGCTT CCGGCGGCGC CCTGGTCGGC 
TACATCGGGA ACGGCACCGC GAACTACCTC CAGGTCAACA ACGTCTCGGC CACCACGGCC 
GGCAGCCACC GCCTGACGAT CTACTACGCC GCCGGCGAGA ACCGCTCGCT CACCGTCAGC 
ATCAACGGCG GCGCCGCGAC CAGCCTGACC ACCCCCGGCA CCGGCGGCTG GGACACCGTC 
GGATCGGTCG CCACGACCGT GACCCTGACC GCGGGCACGA ACACCGTACG GATCGGCAAC 
CCGACCGGCT GGGCGCCGGA CGTGGACCGC ATCGTCGTGT CCTGA

Protein sequence

MRRPLLSRLI PAVVLVVATT GAVAGQSAAK AAGVVPGLTG AAARQAAGPA ADRFRQLTEQ 
RVQAAAAGHG AASSAAATLH TSWGITMPVG VGTGFKALQS VVGGAQPTNG GDFVYAPTAL 
PPGRACMEIT TAYTPSGPDL WAWDWCGGRD QVGKLTAMDS TFLATYTTTV NGHPAYDLDE 
HQTSASGNVW TAYLYNYQTH AWDTFYTSSG TYDLSQYPFG WDMFEVYTTP DPGTGAGYYC 
HDLLGKPFES SSVQLLTGST WTPAAPGNSS PDSTPPAPGS SLDCPALTIT LAHPNDDWTA 
LIGGTSGSSQ SYEAEAAGNT LAGQAAVRSS SGASGGALVG YIGNGTANYL QVNNVSATTA 
GSHRLTIYYA AGENRSLTVS INGGAATSLT TPGTGGWDTV GSVATTVTLT AGTNTVRIGN 
PTGWAPDVDR IVVS