我要投稿

T-RAG = RAG + 微调 + 实体检测

发布日期：2024-04-07 07:10:19 浏览次数： 2590 作者：二师兄talks

T-RAG 方法的前提是将 RAG 架构与开源微调的 LLM 和实体树向量数据库相结合。重点是上下文检索。

介绍

大型语言模型 (LLM) 越来越多地应用于各个领域，包括对私营企业文档的问答，其中数据安全性和稳健性至关重要。

检索增强生成（RAG）是构建此类应用程序的重要框架，但确保其稳健性需要广泛的定制。

本研究分享了部署 LLM 应用程序以对私人组织文档进行问答的经验，使用名为Tree-RAG (T-RAG)的系统，该系统合并了实体层次结构以提高性能。

评估证明了这种方法的有效性，为现实世界的法学硕士申请提供了宝贵的见解。

数据隐私

由于这些文档的敏感性，安全风险是首要问题，因此在公共 API 上使用专有的 LLM 模型来避免数据泄露风险是不切实际的。

这就需要使用可以在本地部署的开源模型。

此外，有限的计算资源和基于可用文档的较小的训练数据集也带来了挑战。

此外，确保对用户查询的可靠和准确的响应会增加复杂性，在此类环境中部署强大的应用程序时需要进行广泛的定制和决策。

成果

我对这项研究感兴趣的是，研究人员开发了一种应用程序，将**检索增强生成（RAG）与经过微调的开源大型语言模型（LLM）**集成起来以生成响应。该模型使用源自组织文档的指令数据集进行训练。

他们引入了一种新颖的评估指标，称为Correct-Verbose，旨在评估生成的响应的质量。该指标根据答案的正确性来评估答案，同时还考虑包含超出原始问题范围的其他相关信息。

T-RAG

Tree-RAG (T-RAG) 的工作流程如下...

对于给定的用户查询，在向量数据库中搜索相关文档块，该块充当LLM上下文学习的上下文参考。

如果查询提到任何组织相关实体，则从实体树中提取有关实体的信息并将其添加到上下文中。经过微调的 Llama-2 7B 模型根据所提供的数据生成响应。

T-RAG 的一个特点是除了用于上下文检索的向量数据库之外还包含实体树。

实体树

T-RAG 的一个显着特点是它结合了实体树和向量数据库以进行上下文检索。实体树存储有关组织实体及其层次结构排列的详细信息。该树中的每个节点代表一个实体，其父节点指示它们各自的组成员身份。

在检索过程中，该框架利用实体树来增强从向量数据库检索的上下文。

实体树搜索和上下文生成的过程如下：

最初，解析器模块扫描用户查询以查找与组织内的实体名称相对应的关键字。
一旦识别出一个或多个匹配，就从树中提取有关每个匹配实体的详细信息。
这些详细信息被转换为文本陈述，提供有关实体及其在组织层次结构中的位置的信息。
随后，该信息与从向量数据库检索的文档块合并以构建上下文。
通过采用这种方法，当用户询问实体时，模型可以获得有关实体及其在组织内的层次定位的相关信息。

考虑上图，上下文生成的检索过程涉及利用组织图中的说明性示例来演示如何执行树搜索和检索。

除了获取上下文文档之外，spaCy 库还与自定义规则一起使用来识别组织内的命名实体。

如果查询包含一个或多个此类实体，则从树中提取有关该实体的分层位置的相关信息并将其转换为文本语句。然后将这些语句与检索到的文档一起合并到上下文中。

但是，如果用户的查询未提及任何实体，则省略树搜索，并且仅利用检索到的文档中的上下文。

综上所述

我发现这项研究很有趣，因为它结合了 RAG 和微调。利用本地托管的开源模型来解决数据隐私问题，同时解决推理延迟、令牌使用成本以及区域和地理可用性问题。

同样有趣的是如何通过 spaCy 框架使用实体进行实体搜索和上下文生成。事实上，这不仅仅是一项研究成果，而是基于构建供实际使用的法学硕士应用程序的经验而得出的经验教训。

参考论文

原文链接：T-RAG = RAG + 微调 + 实体检测 |由 Cobus Greyling
[2402.07483] T-RAG: Lessons from the LLM Trenches (arxiv.org)

你可以关注我以获取更多故事，并在公众号上阅读我的短篇技术文章。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-07

落地AI大模型的五大要素

2024-06-28

一站式智能解决方案：知识管理和问答助手

2024-06-24

企业级 AI，才是通往利润的关键？—— 深度解析 Cohere CEO Aidan Gomez 对谈

2024-06-21

AI Agent给了企业新出路，但这条路并不好走

2024-06-20

《老板必读，AI不一定适合所有公司》

2024-06-06

RPA如何助力文档管理

2024-06-04

[万字长文]GraphRAG技术栈及样例全面解析

2024-05-22

金蝶的AI新物种，企业的掘金洛阳铲

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Manus横空出世，如何获取邀请码

2025-03-06

Kimi、豆包与ChatGPT的对比分析

2024-09-04

AI在实现中医领域的6大应用场景后，将强势洗牌中医行业

2024-12-25

腾讯推出智能工作台产品 ima.copilot 了

2024-10-24

万字长文：人人都能学会的提示词，揭秘18个prompt模版，8个秘诀，助你AIGC从入门到精通，从可用到好用

2024-04-02

从探索到落地：全面解析2024年AI在各行业的突破与应用

2025-01-25

2024中国“大模型+智能客服”最佳实践案例TOP10重磅发布

2024-05-08

可灵AI的网页版上线了

2024-07-07

国内用户如何使用ChatGPT高级实时语音功能教程

2024-09-26

Text2SQL新体验 — 腾讯音乐开源的ChatBI框架

2024-06-17

大家都在问

营销人会被AI取代吗？

2025-04-17

腾讯IMA知识库高阶玩法之六，99%的人不知道：AI时代书还能这么读？

2025-04-17

腾讯文档 “AI搜索” PK 腾讯IMA！2个不同的AI产品框架，哪个产品经理更厉害？

2025-04-17

DataAgent是最容易落地的Agent场景？

2025-04-17

DeepSeek生成的Html网页，怎么分享给别人访问？

2025-04-16

专访Answer.AI创始人周立：AI时代，学什么在未来是有用的？

2025-04-15

工业领域的Manus，为什么是一家杭州公司跑出来了？

2025-04-14

AI开始“记忆”了，对企业意味着什么？

2025-04-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB