我要投稿

GPT大语言模型-RAG增强检索和自训练微调实践思考

发布日期：2024-04-08 08:09:35 浏览次数： 2523 作者：人月聊IT

今天准备结合一个简单的PPT材料，再和大家分享一下GPT和大语言模型涉及到的RAG增强检索和自训练微调方面的一些实践思考。我个人的一些思考不会涉及到太细的一些技术实现，更多是结合我们自己相应的一些GPT的使用实践，包括发现的一些问题，把这些问题也跟大家分享一下。

首先我们来看一下GPT本质上解决的四类问题，其中包括了简单到复杂，复杂到简单，简单到简单，复杂到复杂。

第一类是简单到简单，即给定一个主题，让GPT帮你生成一篇作文或者规划旅游路线。这核心是利用PPT内容生成的能力，它能从简单的命题生成复杂的内容。

第二类是从复杂到简单，例如文章总结和知识归纳。这核心是利用GPT的归纳能力，生成摘要或总结。

第三类是从简单到简单，例如回答类似于“我是谁？”或“这是什么？”的问题，这类问题利用了标准模式匹配逻辑，GPT从自身知识库中进行简单模式匹配和输出。

第四类最为复杂，是从复杂到复杂，例如问题求解和基于长上下文内容的推理。这需要拆解问题，进行推理和归纳，得出最终解决方案。

接下来我们深入探讨从复杂到复杂的问题。当我们面对复杂问题时，通常思维解决思路是拆解和分解，将问题变成多个子问题，每个子问题有标准的解决方法和步骤。解决完每个子问题后，再进行聚合，形成完整的解决方案。这是标准的从复杂到复杂的思路，而GPT也能够解决这类问题。

例如复杂的数学题求解或复杂算法输出，都在GPT的解决范围之内。然而，在特定工作实践相关的复杂问题上，GPT可能会遇到困难。例如软件工程项目源代码生成或基于需求生成技术方案文档等。这些问题之所以难以解决，原因在于：

首先，GPT不清楚如何更好地拆解问题，以及问题拆解逻辑是否与日常处理类似问题的私有方法论一致。

其次，虽然GPT具有一些子问题的标准解决方案，但它不清楚这些子问题的标准解决方案是否符合特定场景的个性化约束规则。

最后，GPT可能不清楚最终问题解决后如何进行聚合，形成完整的解决方案。对于这些特定场景下的问题，公网GPT要解决是相当困难的。

因此，目前常用的思路主要有两种：

一是外挂知识库的学习，即提供个人私有知识库内容。
二是提示语的微调，前提是具备长上下文Token的能力。

首先来看外挂知识库的学习方式，即RAG增强检索。对于RAG增强检索，我简化了整个过程：

首先是自然语言查询，但在查询之前，准备好私有文档知识库，将其切片存储到向量数据库中。查询问题时，关键是Embedding Model，它会进行增强检索，从向量知识库中获取相关匹配片段。得到匹配片段后，结合GPT的大语言模型进行组合，形成最终知识库输出。这样输出不仅借助了外网GPT的能力，还使用了私有知识库，这就是RAG增强检索的核心逻辑。

然而，在实际应用中，我们发现最大的问题在于，私有知识库仅仅成为一个内容检索库，GPT无法学习私有化知识库内容形成的推理逻辑和上下文关系，它只是将其视为一个检索库。这是当前RAG检索增强遇到的最大问题点。