我要投稿

CherryStudio知识库详细设置教程

发布日期：2025-04-04 11:23:56 浏览次数： 2002

作者：AI的回响

微信搜一搜，关注“AI的回响”

字数 1916，阅读大约需 10 分钟

CherryStudio知识库设置

最近，有好几位朋友问我关于CherryStudio知识库的设置问题。

虽然前面已经讨论过很多了，但是我仔细看了看，确实漏掉了一点没有说清楚，那就是知识库的参数设置问题，这一篇就再详细说一下。

新建知识库

在知识库界面选择“添加”，就会弹出添加知识库窗口。

在这里，名字可以自己设置，嵌入模型如果你不知道选哪个，可以先选bge系列。

关于如何选择嵌入模型的问题，我打算放在近期发布的《知识库优化之路（三）》里面，详细介绍。这里暂时先放一放，先继续今天的话题。

知识库设置

知识库添加完成之后，在模型信息那里，有一个设置按钮。

点击之后，就进入了知识库的设置界面。

在这里可以看到，嵌入模型是无法再更改的。这就意味着，嵌入模型只能在新建知识库时选好。

如果实在想改，唯一的做法就是删除知识库，重新创建。

除了嵌入模型，知识库可以设置的参数其实不多，下面分别介绍。

1 请求文档分段数量

这个应该很好理解吧，就是当你向大模型提问时如果添加了知识库，会有几个资料片段会和你的问题一起提交给大模型。

CherryStudio默认的设置是6段，最大值可以设置到30。

但是，这里绝不是越多越好！

因为它受到几个因素的限制。

第一，token消耗（金钱消耗）：

当你把鼠标放在问号上，就能看到CherryStudio官方的提示：请求文档分段数量越多，附带的信息越多，但需要消耗的 Token 也越多。

假如嵌入模型分段时每个片段是500个字，粗略计算按照500个token来说，30段就是15000个token。

参考DeepSeek官方价格（推理模型百万token4元），15000个token就是6分钱。

当然你的对话也不可能只进行一轮，如果是多轮对话，即便考虑缓存命中的情况，几轮对话下来，消耗几毛钱还是有的。

第二，上下文长度限制。

如果你不理解什么是上下文长度，请现在就去补课：

用一个武侠故事，讲清DeepSeek最易被忽视的一个重要使用技巧

DeepSeek-R1的上下文长度是64k，也就是64000个token。

如果你第一轮输入就使用了超过15000token，那么你的对话进行不了几轮，总的上下文长度就会超过64000个。

上下文长度超标以后会有什么后果，如果你刚才去补过课，应该能理解。

第三，API接口限制。

有些API会限制每分钟使用的token总量。DeepSeek官方API没有限制，如果你使用的是硅基流动提供的DeepSeek接口，那就要注意了。

硅基流动官方对于普通版DeepSeek-R1的限制是TPM值 10000，也就是每分钟最多使用10000个token。（Pro版DeepSeek-R1每分钟100万个，可以放心使用）

如果你提问时附带的资料就有15000个token，你猜你的问题还能成功发出去吗？

至于其他平台的API是否有这个限制，我暂时还没了解，大家实际使用时可以留意一下。

第四，匹配度的限制。

即便前面说的三个问题都不存在，也不是你想附带多少个片段都行的，因为还要考虑匹配度的问题，也就是下面要详细说的第二个参数。

2 匹配度阈值

我之所以没有按照设置界面从上玩下依次介绍，而是把匹配度阈值放在第二个说，就是因为它和上一个参数（请求文档分段数量）一起，决定了最终大模型能收到几个片段。

匹配度阈值也很好理解，它就是一个筛选标准，只有匹配度高于某个百分比的片段才有资格被提交给给大模型。

CherryStudio官方可能没有设置默认值，不过据我观察，有些匹配度只有30%多的片段也能被搜到，这种其实已经没有了参考价值。

这个参数的设置范围是0到1，0.1就是10%，0.5就是50%，1就是100%。这个相信大家都能理解。

一般情况下，匹配度阈值设置在70%（也就是0.7）比较合理。

但是，如果你的知识库资料不够多，设置70%可能导致一条都匹配不到。这时候可以适当降低标准，设置成60%或者50%。再低，参考价值就不高了，只会浪费token。

所以，因为有匹配度阈值，请求文档分段数量这个参数并不能完全决定最终提交给大模型的片段数量，而是它们两个共同决定的。

有些情况下，可能匹配到了10个符合匹配度阈值的片段，但是请求文档分段数量设置是6个，那就只选匹配度最高的6个提交给大模型。

有些情况下，虽然设置的请求文档分段数量设置是10个，但是只匹配到了3个符合匹配度阈值的片段，那就只把3个片段提交给大模型。

3 分段大小

分段的问题，之前已经介绍过，相信大家都已经理解了。不理解什么是分段、为什么要分段的朋友，继续补课：

泼冷水：CherryStudio+本地知识库，没你想的那么简单

分段大小指的就是每个片段的字数多少。这个参数，官方不建议修改，我也不建议修改。

因为分段太大，信息虽然可能更完整，但也可能附带一些无用的信息，影响大模型分析判断。

分段太小，搜索命中可能更精准，但也可能丢失一些信息，导致大模型判断不准。

很多嵌入模型会有一些智能化的算法，根据不同的文件类型和内容，自动调整片段长度。

另外，不同的嵌入模型，对于每个片段的长度要求也是不一样的。如果你设置的分段大小超过了嵌入模型的最大值，嵌入时必定会出问题。

所以，分段大小这个参数建议不要自己设定。

4 重叠大小

重叠大小，和分段大小也有关系。

如果分段时过于简单粗暴，只是按照500每段的长度直接拆分，可能有很多句子、段落都会被从中间直接拆断，造成信息不完整。

为了解决这个问题，就允许相邻的两个片段，结尾和开头部分，有一定的内容重复，也就是重叠，这样就能减少有些句子被拆分的可能，在一定程度优化分拆效果。

在CherryStudio里，如果你想设置重叠大小的数值，那你就必须先设置分段大小。

因为刚才我们并不建议自己设置分段大小，所以，重叠大小这个参数，也不建议自己设定。

既然这两个值都没有设置，那也就可以忽略官方的提醒“分段大小和重叠大小修改只针对新添加的内容有效”。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-06-26

“结果付费”能救企业软件？

2025-06-23

腾讯ima知识库-如何一招快速获取知识库的核心内容并构建知识网络图？

2025-06-23

企业AI落地，烧光2000万，CIO被裁...总结了15条教训

2025-06-21

AI的落地难题、应用案例和生产率悖论

2025-06-20

搭建AI知识库踩了37个坑，血泪总结这套避雷手册

2025-06-20

知识库检索匹配的服务化实践

2025-06-19

价值销售AI使用场景三：销售知识库

2025-06-18

KMWorld AI 100 强：助力智能知识管理的企业方向

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Dify+Deepseek：超实用ChatDoc，解锁一个万能文档交互新方法

2025-03-31

Flowith AI，解锁下一代「知识交易市场」

2025-04-21

DeepSeek时代教师大模型应用素养可分为四阶段，您在哪个阶段？

2025-04-12

【避坑血泪史】80次调试！我用Dify爬虫搭建个人知识库全记录

2025-04-03

别再堆文档了，大模型时代知识库应该这样建

2025-04-20

用腾讯 ima 给你配一个知识大脑，保姆级教程

2025-03-29

对不起腾讯ima，Get笔记在碎片知识管理上真的太香了！

2025-05-12

CherryStudio知识库详细设置教程

2025-04-04

数据治理 × 知识库 × 大模型：解开企业智能化转型的 “不可能三角”

2025-04-08

Deep Wiki，真的很nice

2025-04-30

大家都在问

“结果付费”能救企业软件？

2025-06-26

腾讯ima知识库-如何一招快速获取知识库的核心内容并构建知识网络图？

2025-06-23

Agent大潮里，知识库落地走到哪了？

2025-05-28

大模型落地的 “确定性答案”，藏在知识库里？

2025-05-26

我最近是怎么用 Obsidian 给自己“解压”的？

2025-05-14

为什么Data Agent将成为企业未来三年胜负手？

2025-05-07

你是否有这样的困惑：AI大模型交流了好几天，企业还是不知道做什么？

2025-05-07

人人用AI ≠ 组织AI化，什么是智能组织？

2025-04-27

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB