我要投稿

参数知识”是指在 LLM 训练阶段学习的信息。

发布日期：2024-04-21 19:29:02 浏览次数： 2287 作者：HelloTech技术派

背景

LLMs 是个很神奇的工具，但是当我们需要最新数据信息时，它们就毫无用处。其原因是 LLMs 的学习策略为所有“参数知识”。

“参数知识”是指在 LLM 训练阶段学习的信息。在训练过程中，LLM 学会将训练数据集中的信息编码到其内部模型参数中，即模型的参数化知识。

为了添加新的参数知识，我们必须微调 LLM 训练，无论是预训练还是微调，都是昂贵且缓慢的。昂贵和缓慢不是我们需要保持 LLM 知识更新时想要的特性。

检索增强生成（RAG）已成为我们解决这个问题的方法。不是通过微调将知识融入 LLM 中，而是将外部“知识库”插入到 LLM。而且这个知识库是可扩展的，我们可以像管理传统数据库一样管理它，而且它可能比微调更可靠。

例如：LLMs 支持的最强大的应用程序之一是复杂的问答 (Q&A) 聊天机器人。这些应用程序可以回答有关特定源信息的问题。这些应用程序使用检索增强生成（RAG）的技术，从外部数据源检索相关信息，用这些额外的源知识来增强我们的 Prompt，并将该信息输入到 LLM。

什么是RAG？

一句话总结：RAG 是一种用附加数据来增强 LLM 知识的技术。

LLMs 可以推理广泛的主题，但他们的知识仅限于他们接受训练的特定时间点的公共数据。如果我们想要构建能够推理私有数据或模型截止日期之后引入的数据的 AI 应用程序，就需要使用模型所需的特定信息来增强模型的知识。引入适当的信息并将其插入模型提示的过程称为检索增强生成 (RAG)。

RAG架构

典型的 RAG 应用程序有两个主要组件：

索引：用于从源获取数据并为其建立索引的管道。这通常发生在离线状态。
检索和生成：实际的 RAG chain，它在运行时接受用户查询并从索引中检索相关数据，然后将其传递给模型。

从原始数据到答案的最常见的完整流程如下所示：

索引

加载：首先我们需要加载数据。
分割：文本分割器将大的 Documents 分成更小的块。这对于索引数据和将其传递到模型都很有用，因为大块更难搜索并且不适合模型的有限上下文窗口。
存储：我们需要某个地方来存储和索引我们的分割，以便以后可以搜索它们。这通常是使用 VectorStore 和 Embeddings 模型来完成的。

检索和生成

检索：给定用户输入，使用检索器从存储中检索相关分割。
生成：ChatModel / LLM 使用提示生成答案，其中包括问题和检索到的数据。

参考资料：

Q&A with RAG | ?️? LangChain (https://python.langchain.com/docs/use_cases/question_answering/)
Making Retrieval Augmented Generation Fast | Pinecone (https://www.pinecone.io/learn/fast-retrieval-augmented-generation/)

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB