我要投稿

还在靠 RAG 查文档？教你一招，AI 回答更靠谱！

发布日期：2025-04-12 15:39:53 浏览次数： 1543 作者：沉浸式学AI

Repomix：打包代码库为一个文本文件以便大模型检索-首席AI分享圈

在使用 AI 编程的过程中，你是否也遇到过这样一个问题——或者说是一种挑战：手上拥有一大堆文档，但却急需定位其中某条具体的信息。

几年前，答案很简单粗暴：看文档！

而如今，很多人已经转向更智能的做法：直接问 GPT！

更别提配合 Cursor、Cline 这类编程助手，查找答案变得更轻松了。

虽然在大多数情况下，这一方法都能奏效，但偶尔你会发现得到的答案并不全面，有时甚至只是一知半解，远不能满足需求。

实例解析：NotebookLM 的表现

让我以 NotebookLM（借助 Gemini 引擎）为例，讲讲我的亲身体验。

我把 dify 的文档（一款令人惊叹的开源大语言模型聊天工具）输入给 NotebookLM。在这个例子中，我问了怎么创建一个聊天助手，可惜它要么完全不知情，要么只是给出零散的信息。

为什么 AI 答案会显得“随机”？

其实，即便是 Cursor、Windsurf 等强大工具，也可能出现相当随机的回答。

为什么会这样？

主要原因在于：

文档规模 vs. 模型容量
根据文档的大小以及大语言模型（LLM）的 token 限制，这些模型往往会隐式使用检索增强生成（Retrieval-Augmented Generation），简称 RAG 的方式来处理文档。
检索机制
简单来说，系统会先构建一个向量化的数据库，然后基于这个数据库进行搜索。
现阶段挑战
尽管这种方法在不少场景下可以应急，但基于 RAG 的搜索质量，正是当前生成式 AI 领域的研究热点之一。
因此，有时要在瞬间生成一个完整答案，其实并不容易。

一种更简洁的方案：让整个文档成为上下文

幸运的是，借助像 Gemini 这样支持高达 200 万 token 上下文的大语言模型，我们可以有一种更简单的方法。

具体来说：

根据仓库的大小，你可以将整份文档作为上下文传递给 LL.M.
这就相当于把完整的文档都粘贴到支持超大上下文窗口（例如 ChatGPT、Claude 或 Gemini）的对话框里，然后基于这份“完整”上下文进行提问。

这种方法不仅简单直观，还能大大降低因 RAG 检索偶发偏差而导致的信息丢失风险。

实战案例：Dify创建聊天助手

听起来是不是有点抽象？那我们就以实际项目为例，看看如何利用这种方案用 Dify 创建聊天助手。当然，这个方法同样适用于其他任何文档，只要你能获取到源文档的代码即可。

步骤一：寻找文档仓库与目录

开源项目通常都会有公开的文档。你可以通过点击文档页面上的“编辑”按钮迅速定位到对应的 Git 仓库和具体目录。

以 https://docs.dify.ai/为例，你很容易就能发现它们所在的文件夹。

注意：指定准确的文件夹，可以减少传给模型的文件量。

如果直接把整个仓库（包含大量不必要的源代码）作为上下文，往往是得不偿失。最理想的做法是，只提取出其中的 Markdown 文档。例如，在 Dify 的案例中，所有文档都集中在指定文件夹里。

步骤二：压缩文档

既然找到了文档目录，接下来就需要将整个目录中的 Markdown 文件“拼接”成一个单一的文件。

这时，一款名为 Repomix 的开源工具就能大显身手。你可以通过 npx repomix 命令运行它，或者直接访问它的在线版：https://repomix.com/。

操作流程大致如下：

复制 Git 仓库链接
（无需包括路径）。
把需要包含的文件路径填入 “include pattern” 字段（如图所示），并选择 Markdown 作为输出格式。
最后，点击 “pack”。

短短几秒钟后，你就能得到一个文件，其中整合了所选文件夹中所有的内容，以一个长字符串形式呈现。你可以选择复制或下载该文件。

同时，在页面左侧还能看到这个压缩版本的 token 数量。在我的案例中，大约是 475000 token。

（虽然这一数值已经接近 Claude Sonnet 的上限，但与 Gemini 2x 的上百万甚至两百万 token 相比，仍然绰绰有余。）

步骤三：与文档“对话”

现在，将整份文档保存成文件或复制到剪贴板后，就可以前往 Gemini（或者当 token 数量未超限时的 Claude）中粘贴进去。

接下来，你就能基于这完整的文档上下文开始提问或让 AI 自动生成代码了。

在我的示例中，我使用的是 Gemini AI Studio 的免费版本。和之前不同，这一次，我再次询问关于如何添加助手，结果获得了极其全面且正确的答案！

总结

通过上述步骤，你就可以使用同一个提示（一整份文档作为上下文）来提问或生成代码，而不必再依赖那些敷衍的 RAG 检索结果，或是听起来合理却与真实文档不符的“凭空捏造”答案。

温馨提示：

局限性在于 token 限制
主要受制于你所使用模型的 token 限制。例如，Gemini 支持高达 100 万 token，这个容量非常大，能够容纳大量的文档。
探索更多可能性
此外，你也可以进一步探索在编程助手内查找其他相关工具的方法。

希望这篇文章能给大家在 AI 辅助编程的道路上提供一些有用的思路！未来，我们将继续探索更多高效工具和方法，帮你轻松驾驭 AI 编程的无限可能！

欢迎关注我的公众号，获取更多关于 AI 编程与技术前沿的精彩内容！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-13

解决AI在HR应用中产生幻觉的几种方法

2025-04-13

快速构建和部署 RAGS：节省时间和最大化效率的逐步指南

2025-04-13

使用KAG+多模态RAG+智能体建造强大的AI推理机器人

2025-04-13

微软PIKE-RAG开源：解锁专业领域知识理解与推理，RAG新突破！

2025-04-13

本地化大模型接入RagFlow错误记录

2025-04-13

本地部署嵌入模型与重排模型指南

2025-04-13

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-12

基于文本结构分块 - 文本分块（Text Splitting），RAG不可缺失的重要环节

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-13

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

构建Agentic RAG 系统的方法有哪些？

2025-04-09

【AI知识点】什么是Agentic RAG？

2025-04-07

从“人工智障”到“真智能”：AI智能体如何突破最后一道技术壁垒？

2025-04-05

有Embedding模型不够，还需要Rerank模型？

2025-04-04

RAG如何选择最佳分块大小？

2025-04-03

回答我！会不会搭建 DeepSeek 版个人知识库？

2025-04-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部