我要投稿

RAG 进阶：零成本 chat_with_readthedocs

发布日期：2024-09-03 18:22:54 浏览次数： 1961 作者：OpenMMLab

Readthedocs 是知名的文档托管平台，通常用于免费存放 GitHub 和 GitLab 的项目文档。当项目文档较多时，简单的搜索难以满足读者需求，此外在 AI 2.0 时代，“主动寻找答案”这类用户体验已经逐渐落后。

本文将介绍如何基于 HuixiangDou 在 readthedocs 中做源码检索，同时不需要自备 GPU 服务器和域名。

HuixiangDou，开源的适合群聊场景的 LLM 知识助手。

GitHub 链接：

https://github.com/internlm/huixiangdou

（文末点击阅读原文可直达，欢迎 star）

最终效果见下图，HuixiangDou 会先检索项目文档和 python 源码，然后流式作答。点击右下角 “Chat with AI” 即可体验，可尝试问它这些问题：

如何安装 HuixiangDou？
llm_client.py 是干啥用的？

1. 服务部署方法

chat_with_readthedocs 的零成本部署结构如下图所示：

其中，

readthedocs 用于托管中英文文档
OpenXLab 提供 https 入口，这是因为 readthedocs 作为 https 服务，无法内嵌 http 网页
SiliconCloud 提供 text2vec、reranker 和 LLM 模型的远程 API。考虑到 siliconcloud bce 行为和 GitHub 并未完全对齐，若自备 GPU 机器运行模型，精度会更高

以下是具体操作步骤。

1.1 准备代码和文档

假设我们用 mmpose 所有代码和文档做知识库，这里可替换自己的专业知识文档。

cd HuixiangDoumkdir repodirgit clone https://github.com/open-mmlab/mmpose --depth=1# 移除知识库的 .git 方便提交rm -rf .git

调整 gradio_ui.py 的默认配置，使用 config-cpu.ini。

# huixiangdou/gradio_ui.py    parser.add_argument(        '--config_path',        default='config-cpu.ini',        type=str,..

连同自己的知识库和 Huixiangou 源码，一起提交到 GitHub，例如 huixiangdou-readthedocs（https://github.com/tpoisonooo/huixiangdou-readthedocs/tree/for-openxlab-readthedocs）的 for-openxlab-readthedocs 分支。

1.2 创建 OpenXLab 应用

打开 OpenXLab，创建 Gradio 类型应用。

填入上一步的 GitHub 地址和分支名称
服务器选择 CPU

确认后，修改应用设置：

自定义启动文件改为 huixiangdou/gradio_ui.py
由于代码已开源，需配置环境变量。HuixiangDou 会优先使用 config 配置中的 token，找不到时会尝试检查 SILICONCLOUD_TOKEN 和 LLM_API_TOKEN，如图：

同步代码、启动应用。首次运行需要 10min 左右建立稠密和稀疏特征库，结束后应该能看到一个 gradio 应用。例如:

https://openxlab.org.cn/apps/detail/tpoisonooo/HuixiangDou-readthedocs

在浏览器中按 F12，检查源码，可获得服务对应的 https 地址：

src="https://g-app-center-000704-0786-wrbqzpv.openxlab.space"

只要不在 OpenXLab 中点击 “删除应用数据”，这个地址就是固定的。

1.3 使用 readthedocs 自定义主题

假设你已经熟悉 readthedocs 基本用法，可以直接拷贝 HuixiangDou docs 目录。

zh 或 en 目录皆可
在 requirements/doc.txt 设置自定义主题

https://github.com/tpoisonooo/pytorch_sphinx_theme 是我们的自定义主题实现，主要是：

在 layout.html 创建了一个 chatButton 和空白 container
为 chatButton 绑定事件。按钮点击时，空白 container 将加载 https 地址，也就是前面的：bash https://g-app-center-000704-0786-wrbqzpv.openxlab.space
在 theme.css 中，您可修改自己喜欢的样式。

最后，在 readthedocs.io 配置自己的项目，Build Version 即可。

2. 代码检索方案

本文使用稀疏方法实现代码检索。