Gene Caci_6867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6867
Symbol
ID	8338233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	7931630
End bp	7933069
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	67%
IMG OID	644959956
Product	Ricin B lectin
Protein accession	YP_003117547
Protein GI	256395983
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4833] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.269811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGC GAACAGGAAA GACCCGAATT CTCGGCGCGG TCGTGACAGC CGCCGCCCTC 
GCCGTCTCGG TGCTGATCGG AGCAGCCGGC ACCGCTTCGG CGGCCTCGCC CGCCGCCATT 
GGCGCCGCCG CGCTGATGAA GTCCTATGAC TCCACGACCG GCCAGATAGG CACGGGCTGG 
TGGAACTCCG CGGTGGCCCT GAGCACGATC GAGACCTACC AGCAGACGAC GGGTGACAGC 
TCGTACGCCT ACGCGATGTC CGGGGCGTTC GCCAAACACC AGTCCTCGAA CTTCGAGAAC 
GAGTACATGG ACGACACCGG CTGGTGGGCC CTGGCCTGGG TCCAGGCCTA CGACATCACC 
GGCAACTCCG CCTACCTGCA GATGGCCCGC ACCGATGCCG ACTACATCCA CGGCTATTGG 
GATTCGACCT GCGGCGGCGG GGTCTGGTGG AGCAAGGCCA AGGGATACAA GAACGCCATC 
CCCAACGAAC TCTTCCTCGA ACTGACCGCC GACCTCCACA ACCGCATCCC CGGCGACACC 
CAGTACCTGG GCTGGGCGAA GCAGGAGTGG AGCTGGTTCA GCGGCAGCGG CATGATCAAC 
AGCTCGCACC TGGTCAACGA CGGCCTCAGC AGCTCCTGCA AGAACAACAA CGGCATCGCC 
TGGTCCTACA ACCAGGGCGT CGTACTGGGC GGCCTGGCGG CGCTGTCCCA GGCCACCGGG 
GACACCAGTC TCCTCACCAC GGCCCGCCAG ATCGCCGACG CGGCGACGTC CAGCCTGTCG 
CAGAACGGCG TCTTCACCGA GTCTTGCGAG CCGACGAACT GCAACCAGGA CCAGGTCTCC 
TTCAAGGGCA TCTTCGTGCG CGGCTTGCGG ACCCTGGCCT CAGCCGCCGG CACCAGCGCC 
TACGACGCGT GGTTCACCGC CCAGGCCGGC TCGATCGAGG CGCACGACAC CTCCGCCACG 
GGGTTCGGCG TGTCCTGGGC CGGGCCGATC CGACAGCTGT CCTCCAGCTC CACGGCGAGC 
GCCGAGGACG CACTCGTCGC GGCCCTGCCG GGAGCCGGAA CGCCGGCCGG CGCGATGAAA 
TCGGGGATCG CCGGCAAGTG TCTGGACGAC CCCAAGGGAT CGTCGACGCC GGGAACGAAG 
GCCCAGCTGT GGGACTGCAA CGGTGGATCG ACCCAGCAGT GGACGGTCGT GGGTCAGACG 
CTGCGTGTTC AGGGCCTCTG CCTTGACATC ACCGGCGCCC GCACCGCCAA CGGAACGCTC 
GTGGAGCTGT GGAGCTGCAA CGGCGGCGCC AACCAGAATT GGACGTCCGC CAACGGCGCT 
GTGGCCAATC CCGCGACCGG CAAGTGCCTC GACGTTCCGC ACTCCAGCAC CACGAACGGC 
ACTCAGCTCC AGATCTGGGA CTGCAACGGC GGCGCCAATC AGAAGTGGAT TCTGCCTTGA

Protein sequence

MKARTGKTRI LGAVVTAAAL AVSVLIGAAG TASAASPAAI GAAALMKSYD STTGQIGTGW 
WNSAVALSTI ETYQQTTGDS SYAYAMSGAF AKHQSSNFEN EYMDDTGWWA LAWVQAYDIT 
GNSAYLQMAR TDADYIHGYW DSTCGGGVWW SKAKGYKNAI PNELFLELTA DLHNRIPGDT 
QYLGWAKQEW SWFSGSGMIN SSHLVNDGLS SSCKNNNGIA WSYNQGVVLG GLAALSQATG 
DTSLLTTARQ IADAATSSLS QNGVFTESCE PTNCNQDQVS FKGIFVRGLR TLASAAGTSA 
YDAWFTAQAG SIEAHDTSAT GFGVSWAGPI RQLSSSSTAS AEDALVAALP GAGTPAGAMK 
SGIAGKCLDD PKGSSTPGTK AQLWDCNGGS TQQWTVVGQT LRVQGLCLDI TGARTANGTL 
VELWSCNGGA NQNWTSANGA VANPATGKCL DVPHSSTTNG TQLQIWDCNG GANQKWILP