AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Linkedin的GraphRAG客服问答系统实践
发布日期:2024-05-02 11:26:42 浏览次数: 1888


?2024年4月26日,Linkedin领英发表了非常有趣的论文 ("Retrieval-Augmented Generation with Knowledge Graphs for Customer Service Question Answering"),将RAG与知识图谱相结合以提高检索准确性和回答质量。

? 摘要:

在客户服务技术支持中,迅速准确地检索相关的过往问题对于高效解决客户咨询至关重要。传统的检索方法在大型语言模型(LLMs)中检索增强生成(RAG)将大量过往问题跟踪工单视为简单文本,忽略了关键的问题内部结构和问题之间的关系,这限制了性能。

我们引入了一种新颖的客户服务问答方法,将RAG与知识图谱(KG)相结合。我们的方法从历史问题构建知识图谱,用于检索,保留了问题内部结构和问题之间的关系。在问答阶段,我们的方法解析消费者的查询并从知识图中检索相关子图以生成答案。这种知识图谱的整合不仅通过保留客户服务结构信息提高了检索精度,还通过减轻文本分割的影响提高了回答质量。

在我们的基准数据集上进行的实证评估,利用了关键检索(MRR、Recall@K、NDCG@K)和文本生成(BLEU、ROUGE、METEOR)指标,显示我们的方法在MRR上的性能优于基准方法 77.6%,在BLEU上优于基准方法 0.32。我们的方法已在领英客服团队内部部署约六个月。

检索增强生成与知识图谱框架概述。该图的左侧展示了知识图谱构建过程;右侧展示了检索和问答过程。

?

本文讨论了检索增强生成(RAG)与知识图谱(KG)的整合,以更多基于事实和基于真相的方式极大地改善客户服务问答(QA)。

? 传统RAG的限制:

  • 限制 1 -由于忽视结构而导致检索精度下降:

问题跟踪文档,如 Jira,具有固有结构并具有相互关联,例如引用“问题A与问题B相关/复制/由问题B引起”。传统方法将文档压缩为文本块导致重要信息的丢失。我们的方法将问题工单解析为树状结构,并进一步连接单个问题工单以形成相互关联的图,保持实体之间的这种固有关系,从而实现高效的检索表现。

• 限制 2 - 由于分段而导致答案质量降低:

将复杂的问题工单分成固定长度的段以适应嵌入模型的上下文长度限制可能导致相关内容的分离,进而导致答案不完整。例如,在文本分割过程中,描述问题起始和解决方案结尾的问题工单可能会被分割,导致解决方案的关键部分被遗漏。我们基于图的解析方法通过保持工单部分的逻辑连贯性来克服这一限制,确保提供完整且高质量的响应。

? 数据和方法:

该方法从历史问题(JIRA工单)构建知识图谱,用于检索,并根据知识图谱中的相关子图生成答案。JIRA系统已知具有内置的层次结构和固有结构,使其更适合(和方便)用于构建知识图谱。

? 实验结果和分析:

这种方法在平均倒数排名(MRR)上比基准线高出了77.6%,在BLEU分数上为0.32。

? 实际应用效果:

将检索增强生成(RAG)与知识图(KG)相结合已经改善了检索和回答指标,以及整体服务效果。该方法已在领英客服团队内部部署,将每个问题的中位解决时间减少了 28.6%。 

? 未来工作重点:

开发自动机制来提取图模板,生成知识图谱,增强系统的适应性;研究基于用户查询的知识图谱动态更新,以改善实时响应能力;以及探索系统在客户服务之外其他领域的适用性。

论文全文如下: 

[2404.17723] Retrieval-Augmented Generation with Knowledge Graphs for Customer Service Question Answering (arxiv.org)

https://arxiv.org/abs/2404.17723


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询