AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Coze教程之;知识库的奥秘
发布日期:2024-07-18 20:26:11 浏览次数: 9129



OpenAI的LilianWeng将以LLM为驱动的 AI Agent,形式化为如下的公式:


AI Agent=LLM(大模型)+Planning(规划)+ Memory(记忆)+Tools(工具)

而知识库是LLM(大模型)重要重要组成部分;在coze中的知识库分三个部分:文本,表格,照片。今天船长先以文本进行实操。


知识库的运行原理就是:通过文档加载——文本分割——存储——检索——输出

创建bot


名称:就是知识库的名字,但是要保证在一个空间内,名称不可重复


导入类型:通过创建bot我们可以看到有五种方式:本地文档,在线数据,Notion,飞书,自定义。那我们分别看一下都是如何使用的。

本地文档


官方讲解:选择本地文档从本地文件中导入内容。在上传文档时,请注意:支持txt,pdf、.docx格式;最多可上传 300 个文件每个文件不超过 20MB,PDF 最多 250 页。

模型如何正确分割我们想要的内容呢?通过markdown格式进行文本分割。如图:

每个问题都是使用###作为文本分隔符开头(这是Markdown的语法)

第二种识别分割办法?通过一问一答的形式

问+答=问答格式

创建知识库——导入我们设定好的文件

设定名称和描述

点击上传我们设定好的文件

选择自动分段或者自定义分段

这样就可以分段好

效果

飞书——云端知识库

官方讲解:参考以下操作,从飞书云文档中导入内容。选择飞书从飞书云文档中导入内容。在新增知识库页面,单击授权,选择要导入内容的飞书账号。单击安装,在授权的飞书帐号中安装扣子应用。


飞书又称为云端知识库,通过飞书的线上文档进行导入。船长就直接带大家如何使用飞书云文档吧。

创建bot

点击授权

只要成功授权你的飞书,那你飞书上的文档都会显现出来。选择我们需要导入的文件

后面的步骤 都是一样,先分段后确认

效果是一样的,通过问得到答。

在线数据

官方讲解:选择在线数据从在线网页中上传内容。支持自动采集和手动采集两种方式。自动采集:支持从单个页面或批量从指定网站中导入内容。

-添加单个页面的内容

添加方式:选择添加单个。

更新频率:选择是否自动更新指定页面的内容及自动更新的频率。

网址URL:输入要采集内容的网址。批量添加网页内容参考以下操作。

-批量添加网页内容

添加方式:选择批量添加。

根地址或网站地图:输入要批量添加的网页内容的根地址或 sitemap 地址,然后单击导入。

导入成功后,单击确认。

-手动采集:支持标注要采集的内容,内容上传成功率高。


通过网页的URL进行网页数据的抓取,再保存到知识库内


首先创建知识库——勾选在线数据——选择自动采集

选择添加单个——选择更新或者1天内更新——输入网页URL

等待读取

依旧选择自动分段和保存

Notion

官方讲解:从 Notion 中导入内容,

选择 Notion

在新增知识库页面,单击授权。

在弹出的页面完成登录,并选择要导入的页面。

选择要导入的内容的页面,然后单击下一步。

自定义知识库

官方讲解:

选择自定义方式手动添加要导入的内容。

在弹出的页面,输入文档名称。

输入内容。

单击添加图片上传图片。

单击下一步上传内容。


自定义也就是不通过任何形式的文档进行创建的知识库,我们直接把需要添加到知识库的内容直接输入到自定义内容中。

创建自定义知识库——添加内容——后续经过分段清洗就可以


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询