我要投稿

T-RAG=RAG+微调+实体识别

发布日期：2024-03-28 21:58:16 浏览次数： 3326

作者：奇点智源

微信搜一搜，关注“奇点智源”

T-RAG技术将 RAG 架构与开源的微调语言模型 (LLM) 和实体树向量数据库相结合的基础之上，用于支持语境检索。

背景介绍

大型语言模型 (LLM) 在各个领域得到越来越广泛的应用，尤其在使用私有企业文档的问答场景中。但由于数据安全性和模型稳定性至关重要，定制化成为必然。

本文分享了针对企业私有文档、使用 Tree-RAG (T-RAG) 系统部署 LLM 问答应用的经验。

这种方法集成了实体层级信息以获取更优异的表现，而评估结果验证了它的有效性。这些经验对于将 LLM 落地到实际应用中具有实际指导意义。

数据隐私

由于文档的敏感性，安全风险成为首要考虑。为避免数据泄露，使用公有 API 调用私有 LLM 模型的方法变得行不通。这就需要使用可以部署在内部的开源模型。此外，有限的计算资源和基于现有文档建立的小型训练数据集都会带来相应的挑战。

如何在这样的环境下确保对用户问询提供可靠、准确的响应，就需要大量的定制化工作，进而衍生出了一系列复杂的考量因素。

技术亮点

这项研究的价值在于，他们提出了一种结合检索增强生成 (RAG) 方法和基于企业文档数据集微调的开源 LLM 模型的应用。

此外，本研究还提出了一个新的评估指标，称为“Correct-Verbose”。旨在评估所生成回复的质量。该指标既考察答复的正确性，也兼顾答案是否涵盖了问题范围之外的其他相关信息。

T-RAG

Tree-RAG (T-RAG) 的工作流程如下...

在面对用户的问题时，系统先从向量数据库中搜索相关的文档片段用作 LLM 的背景知识。

如果查询中提到了任何与组织相关的实体，系统将从实体树中提取关于这些实体的信息并添加到背景知识中。随后，经过微调的 Llama-27B 模型会根据已呈现的信息生成答复。

实体树

T-RAG 的一个显著特点是在向量数据库之外引入了实体树 (entities tree) 来辅助语境检索。这个实体树中储存了与企业组织相关实体的详细信息以及它们的层级结构。树中的每个节点都代表一个实体，父节点表明该实体所属的组别。

在检索过程中，T-RAG 可以利用实体树来增强从向量数据库中检索到的语境信息。实体树的查询和语境生成过程如下：

首先，一个解析器模块会在用户的查询中扫描与组织内部实体名称相对应的关键字。
如果识别出一个或多个匹配项，会从实体树中提取关于每个匹配实体的详细信息。
这些细节被转化为文本语句，提供关于该实体及其在组织层级结构中位置的信息。
随后，这些信息会与从向量数据库中检索到的文档块相结合，以构建最终的语境。
通过这种方法，当用户提出关于特定实体的问题时，模型可以获取有关这些实体及其在组织中的层级位置的结构化知识。

结合上图，我们用一个组织结构图中的实例来直观说明语境生成过程中的树搜索和检索过程。

除了获取相关的背景文档，系统还使用 spaCy 库以及自定义规则识别出组织内的命名实体。
如果查询中包含一个或多个这样的实体，那么系统会从实体树中提取出关于该实体层级位置的相关信息，并将其转化为文本语句。
这些语句随后与检索到的文档一起被整合为最终的语境。
值得注意的是，如果用户的查询中没有提及任何实体，那么系统将会跳过树搜索步骤，仅使用从检索文档中获取的语境。

总结

这项研究具有一定的启发性，因为它将 RAG 方法、模型微调与实体识别相结合。一方面，通过使用内部部署的开源模型来解决数据隐私问题；另一方面，有效地降低了推理延迟、token 使用成本，同时也兼顾了不同地区的用户需求。

此外，研究中采用了 spaCy 框架进行实体搜索和语境生成，这一方法也很有借鉴意义。而最重要的是，这不仅仅是一项理论研究，更是基于构建实际 LLM 应用的经验总结，具有很高的实践价值。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-06-28

一站式智能解决方案：知识管理和问答助手

2024-06-24

企业级 AI，才是通往利润的关键？—— 深度解析 Cohere CEO Aidan Gomez 对谈

2024-06-21

AI Agent给了企业新出路，但这条路并不好走

2024-06-20

《老板必读，AI不一定适合所有公司》

2024-06-06

RPA如何助力文档管理

2024-06-04

[万字长文]GraphRAG技术栈及样例全面解析

2024-05-22

金蝶的AI新物种，企业的掘金洛阳铲

2024-05-22

打造高效AI工作流的终极利器！AirOps：革命性AI工具助力企业快速成长

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Skills商店来了：5万人在用的Top 10热门Skills，我帮你试了一遍

2026-01-24

我分析了 1000 个 skills，这是最推荐的 30 个

2026-02-24

扔掉第三方插件吧！Obsidian官方知识库Skills来了！

2026-01-08

Agent Skills 管理神器：SkillsLM 一条命令覆盖 9 个平台

2026-01-18

飞牛OS | 相遇clawdbot，让小龙虾接管飞牛充当贾维斯

2026-01-29

发现了 4 个好玩 SKills，已经在 GitHub 上开源了。

2026-01-23

字节跳动新推出的AI agent平台：AnyGen

2026-01-01

Hi，你的一号员工 WorkBuddy，今日上岗内测！

2026-02-06

这款免费的Gemini神级插件，竟然还有那么多人没用上！效率提升99%

2026-01-24

claude code更新了，利用Antigravity Tools用上了cc

2026-01-21

大家都在问

AI编程元年：初级开发者被「团灭」？

2026-03-21

OpenClaw威胁下，大厂APP会被降维成信息通道么？

2026-03-21

从业者讲述：被315曝光的GEO，如何精准“忽悠”AI？

2026-03-16

GPT-5.4、OpenClaw冲击波：未来2-3年内，80%的测试工程师会被裁掉？

2026-03-07

AI Coding思考：从工具提效到范式变革，我们还缺什么？

2026-03-02

Nano Banana 2 实测：8 大落地场景 + 全部 Prompt，AI 绘画 SOTA 到底逆天在哪？

2026-02-28

.md 编译了个人认知，什么来编译企业的认知？

2026-02-27

为什么越来越多的软件被“用完即弃”？

2026-02-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw