Gene Caci_4911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4911
Symbol
ID	8336265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5599639
End bp	5601057
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	68%
IMG OID	644958010
Product	Ricin B lectin
Protein accession	YP_003115612
Protein GI	256394048
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0412] Dienelactone hydrolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.036155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGAA GCTTGAATCC ATTCCCGAAA TCCCGTTCCG AAGACGTTCG GCGGCAGCGC 
GCCCGACCCG GACGGCGTCC GCGATCCGGC GGGGTCGCCC TGGCCGTCCT CGCACTGATC 
ACCGCGTTGT TCGGCGCGGC GACCCTGTCC CCGGCGTCGG CGTCGGCGTC GGCGTCCGCA 
TCGGCGCCGG CGGCGTCCCG GGTCCAGGCC GCCGCCTCGG GGAACACCTA CCAGCGCGGT 
CCGGATCCGA CCCTGTCCAG CGTGGCGGCC TCCACCGGGC CGTTCGCGAC CGCGCAGGTC 
TCCGTGCCCG CGGGCTACGG CTTCAAGGGC GGGATGATCT ACTACCCGAC CGACACCAGC 
CTGGGGACCT GGGGCGCGGT CGCCATCGTG CCCGGCTACA CCGCGCTGTT CGCGAACGAG 
GAAGCCTGGA TGGGGCCCTG GCTGGCCTCC TTCGGGTTCG TGGTGATCGG CGTGGAGACC 
AACAGCACCA CCGACTACGA CACGCAGCGC GGGACAGAGC TGCTGGCGGC GCTGAACTAT 
CTCACCACGC AGAGCCCGGT GCGCGACCGG GTGGATCCGA CCCGGCTGGG CGTGATCGGG 
CACTCGATGG GCGGCGGCGG AGTCGTCTAC GCCACCGAGC ACCAGCCCTC GCTCAAGGGC 
GCCGTGGCGC TGGCGCCGTT CTCCCCGTCG CAGAGCATGG CCACGGACAC CGTGCCCACC 
ATGGTCATGG GCGGCCAGAA CGACACCGTG GTCACACCGT CCTACCTCGC CGGCCTGTAT 
GCGACGCTGC CCGCCTCGAC GCAGAGCGAC TTCATCCAGA TCGCCGGAGC CGATCACATC 
TACTACACCC ACCCCAACCC GGTGGAGATG AGGATCCTGA TTCCCTGGCT CAAGACGTTC 
CTGGACGAGG ACACCCGCTA CACCCAGTTC CTGTGCCCGA CCCTCGCCGA CCCGAGCGGG 
GTGTCGATGT ACCAGAGCAA GTGCCCGTAT GTGCCCGGTG GCGGCTCTAC TCCTCCTCCG 
CCGGCCGGTG GTGCGCTGCA CGCTGTCGGT GCAGGTAAGT GTGTGGATGT GCCGAACTCG 
ACCACCACCA GTGGGACGCA GGTGCAGATC TACTCCTGCA ATGGCCAGGC CAACCAGGCC 
TTCACCCACA ACTCCGCCGG TGAGCTAGCC GTCACCGACG CCGGAGTCAC CGACTGCCTG 
GACGCCAACG GCAAGGGAAC CACCAACGGC ACCAAGGTCA TCATCTATCC CTGCAACGGC 
CAGCCCAACC AGCAATGGAC GATCAACTCC AACGGCACCA TCACCGGAGT GCAGTCAGGA 
CTCTGCCTCG ACGTCACCGG CGCATCCACC GCCAACGGCG CCCTAGTGGA GCTGTGGACC 
TGCAACGGCG GCAGCAACCA GAAATGGACT CTGAGCTGA

Protein sequence

MRRSLNPFPK SRSEDVRRQR ARPGRRPRSG GVALAVLALI TALFGAATLS PASASASASA 
SAPAASRVQA AASGNTYQRG PDPTLSSVAA STGPFATAQV SVPAGYGFKG GMIYYPTDTS 
LGTWGAVAIV PGYTALFANE EAWMGPWLAS FGFVVIGVET NSTTDYDTQR GTELLAALNY 
LTTQSPVRDR VDPTRLGVIG HSMGGGGVVY ATEHQPSLKG AVALAPFSPS QSMATDTVPT 
MVMGGQNDTV VTPSYLAGLY ATLPASTQSD FIQIAGADHI YYTHPNPVEM RILIPWLKTF 
LDEDTRYTQF LCPTLADPSG VSMYQSKCPY VPGGGSTPPP PAGGALHAVG AGKCVDVPNS 
TTTSGTQVQI YSCNGQANQA FTHNSAGELA VTDAGVTDCL DANGKGTTNG TKVIIYPCNG 
QPNQQWTINS NGTITGVQSG LCLDVTGAST ANGALVELWT CNGGSNQKWT LS