我要投稿

如何构建基于大模型的AGV私有知识库

发布日期：2024-06-14 05:15:40 浏览次数： 2509 作者：复合机器人AGV

自OpenAI革命性的发布ChatGPT发布以来，大模型浪潮已经席卷了几乎各行业，当然也包括AGV行业。但是当我们将大模型应用于实际业务场景时会发现，通用的基础大模型有以下缺点，可能无法满足实际业务需求：

1.知识的局限性：模型自身的知识完全源于它的训练数据，而现有的主流大模型（ChatGPT、文心一言、通义千问…）的训练集基本都是构建于网络公开的数据，对于一些非公开的或离线的数据是无法获取到的，这部分知识也就无从具备。

2.幻觉问题：所有的AI模型的底层原理都是基于数学概率，其模型输出实质上是一系列数值运算，大模型也不例外，所以它有时候会一本正经地胡说八道，尤其是在大模型自身不具备某一方面的知识或不擅长的场景。而这种幻觉问题的区分是比较困难的，因为它要求使用者自身具备相应领域的知识。

3.数据安全性：对于企业来说数据安全至关重要，没有企业愿意承担数据泄露的风险，将自身的私域数据上传第三方平台进行训练。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。

如何解决这个问题呢？RAG是解决上述问题的一套有效方案。

一、什么是RAG?

检索增强生成（Retrieval Augmented Generation）简称 RAG，是一种使用外部知识库来补充大语言模型的上下文并生成响应的技术。已经成为当前最火热的LLM应用方案。简单来讲，RAG就是通过检索获取相关的知识并将其融入Prompt，让大模型能够参考相应的知识从而给出合理回答。因此，可以将RAG的核心理解为“检索+生成”，前者主要是利用向量数据库的高效存储和检索能力，找到目标知识；后者则是利用大模型和Prompt工程，将召回的知识合理利用，生成目标答案。

检索增强生成（RAG）与大语言模型（LLM）成为构建私有或本地知识库的主要手段。

下面将介绍如何通过Ollama和AnythingLLM构建本地AGV知识库。

二、Ollama和AnythingLLM安装

Ollama是一个专注于本地运行大模型语言的架构，它使得用户能够在自己的计算机上轻松部署和使用大语言模型，而无需依赖昂贵的GPU资源。这就给创建基于大模型的本地化知识库提供了可能性。

AnythingLLM是Mintplex Labs开发的一款可与任何内容聊天的私人Chat GPT。它是一个性能优良的RAG框架，能够将任何文档、资源或者内容片段转换为大语言模型在聊天中可以利用的相关上下文。且无需调用外部接口，不发送本地数据确保了用户数据安全。

关于Ollama和anythingLLM的下载和安装可从网上搜索，在此不做赘述。

三、AGV知识库数据准备

数据准备一般是一个离线的过程，主要是将私域数据向量化后构建索引并存入数据库的过程。主要包括：数据提取、文本分割、向量化、数据入库等环节。

数据准备是本地知识库的重要一环，它决定了本地知识库的最终效果。它有2个关键因素：一是本地文档数据质量；二是文本分割的原则，如果切分不好会损失很多语义信息，导致大模型输出的效果一般，因此需小心的调试。

四、测试效果

将本地文档导入后即可测试效果，为了达到满意的效果还需对模型的参数进行微调。从下调可以看出效果还可以接受。

本文引入RAG架构构建了基于AGV的私有知识库。测试结果表明，有了RAG的加持可以利用大语言模型的优势，快速构建私有的本地知识库，又保证了数据安全性。利用此知识库可快速掌握相关知识提升工作效率。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-19

Exa：给 AI Agent 的 “Bing API”

2025-04-19

Chrome过时了，AI Agent需要自己的浏览器。

2025-04-19

n8n + mcp王炸组合：5个节点轻松搭建一个AI工作流

2025-04-18

火山引擎OS Agent解决方案、豆包1.5·UI-TARS模型发布

2025-04-18

前沿导读 | 基于大模型智能体的出行行为模拟

2025-04-18

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

AI 重要概念科普与热门技术解析

2025-04-18

我对于AI领域商业模式的思考

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

谁是MCP 的 AI 好搭档？

2025-04-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部