推荐语
掌握RAGFlow知识库建设,提升AI聊天智能水平。核心内容:1. 系统模型设置及模型供应商选择2. 知识库创建与配置步骤详解3. 文件上传与管理,分块模板选择与嵌入模型应用
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
点击头像,选择模型供应商,然后点击【系统模型设置】按钮,会弹出设置窗口,然后选择聊天模型,因为之前我的模型是火山引擎的,所以这里我选择了火山的DeepSeek-V3其中嵌入模型和Rerank模型是有系统自带的,如果不需要系统自带的,可以自己提供对应的模型。知识库、聊天和文件管理是RAGFlow的三大支柱功能。RAGFlow 的 AI 聊天基于知识库。RAGFlow 的每个知识库都充当知识源,将从本地机器上传的文件和文件管理中生成的文件引用解析为未来 AI 聊天的真正“知识”。点击首页的【知识库】Tab,然后点击页面上的【创建知识库】按钮,弹出新建知识库的命名弹窗,我们填写好知识库名称后,点击确定后会跳转到配置知识库页面:在这个页面中,我们可以重新修改知识库名称,也可以直接通过此处上传文件。RAGFlow提供多种分块模板,方便对不同布局的文件进行分块,并确保语义完整性。在Chunk 方法中,您可以选择适合您文件布局和格式的默认模板。下表列出了每个支持的分块模板的描述和兼容的文件格式:嵌入模型将块转换为嵌入。一旦知识库有了块,它就无法更改。要切换到不同的嵌入模型,就必须删除知识库中所有现有的块。这是因为我们必须确保使用相同的嵌入模型将特定知识库中的文件转换为嵌入(确保在相同的嵌入空间中进行比较):RAGFlow的文件管理允许将一个文件链接到多个知识库,在这种情况下,每个目标知识库都保存对该文件的引用。在知识库中,我们还可以将单个文件或文件夹(批量上传)从本地上传到知识库,在这种情况下,知识库会保存文件副本。虽然直接将文件上传到知识库似乎更方便,但是RAGFlow官方还是强烈建议我们将文件上传到文件管理,然后将其链接到目标知识库。这样可以避免永久删除上传到知识库的文件。我们可以在【数据集】界面中,点击【新增文件】按钮,弹出上传文件页面,点击或者拖动文件到提示区域即可上传:我们可以在上传页面上勾选【创建时解析】,也可以等上传完毕后再列表操作栏找那个进行解析。值得注意的是,必须解析成功后,才能进行问答!文件解析是知识库配置中的一个重要环节。RAGFlow 中的文件解析有两个含义:根据文件布局对文件进行分块,并在这些分块上构建嵌入和全文(关键字)索引。选择分块方法和嵌入模型后,我们才可以开始解析文件:
在数据集列表中,单机解析按钮(播放图标),开始文件解析。搜索知识库的功能仅支持根据知识库名称搜索,相对来说是比较简单的一个搜索功能,如果可以基于内容搜索,或者基于一些其它参数来搜索,相信这块会更灵活,期待RAGFlow后期版本的加强!您可以删除知识库。将鼠标悬停在目标知识库卡的三个点上,就会出现删除选项。一旦您删除知识库,root/.knowledge目录下的关联文件夹将自动删除。如果是直接上传的文件,那么我们删除后上传到知识库的这份文件就没有了,被完全删除了;如果我们是在文件管理中创建的文件,知识库是引用了这份文件,那么我们删除的实际上是文件的引用,相关文件仍然还存在于文件管理中。1、ragflow 可以定义嵌入知识的语言类型:中文或英文2、ragflow 可以选择知识的内容类型:单页/书籍等4、支持使用rerank(重新排序模型)/img2twxt(图像转语义)好了,写了这么多,也差不多介绍完了RAGFlow是如何创建知识库的,相对来说,RAGFlow知识库还是很强大的,单纯知识库功能来说,Dify的知识库功能稍微逊色于RAGFlow,但是综合来看,Dify更全面,并且,我们可以让Dify连接RAGFlow的知识库作为外部知识库,这样就可以做到两个优势相结合了!等我继续研究后,再给大家出一集Dify连接RAGFlow知识库作为外部知识库的教程!关注下方我的公众号
我已经建了一个群,回复【666】获取群二维码,只需要回复蓝色数字哦