我要投稿

LARA：用于多轮意图分类的语言适应性检索增强的大模型

发布日期：2024-03-27 18:15:41 浏览次数： 3521 作者：PaperAgent

随着大型语言模型（LLMs）在文本分类任务中取得显著成就，研究者开始探索上下文学习（in-context learning）在单轮分类任务中的应用。然而，这些研究主要集中在单一语言和单轮分类任务上。多轮意图分类任务由于对话上下文的复杂性和不断演变的特点而具有挑战性，尤其是在跨多种语言的聊天机器人交互中。此外，多轮数据集的收集和注释成本高昂，且在现实世界中难以获得。

多轮意图分类数据集的注释挑战

LARA框架通过结合微调的小型模型和检索增强机制，解决了多轮意图分类的挑战。LARA首先使用基于XLM的模型对单轮分类数据集进行训练，然后利用检索增强机制，通过检索与多轮测试样本语义相似的单轮示例来构建提示，从而促进ICL。这种方法允许LARA动态地利用过去的对话和相关意图，提高了对上下文的理解。LARA还包括自适应检索技术，增强了LLMs的跨语言能力，而无需进行广泛的重新训练和微调。

它通过以下几个关键步骤来提高分类任务的准确性和效率：

单轮意图识别模型（Mc）：LARA使用一个基于XLM（Cross-lingual Language Model）的文本分类模型，该模型在单轮对话数据集上进行训练。这个模型用于将用户的查询映射到预定义的意图类别中。
候选意图选择：在多轮对话中，LARA首先确定可能的候选意图。这是通过将当前查询与历史查询结合起来，并使用Mc模型来预测每个组合的意图来完成的。
检索增强：LARA利用预训练的XLM模型来检索与测试查询在语义上相似的单轮示例。这些示例作为演示（demonstrations），为大型语言模型（LLMs）提供决策依据，并在上下文学习（ICL）期间指导模型输出格式。
提示构建和LLM推理：LARA构建一个输入提示（P），结合了任务指令、检索到的演示、对话上下文和最终的用户查询。这个提示用于指导LLM进行推理，以识别多轮对话中的意图。

语言适应性检索增强的流程

LARA在六个语言的电子商务多轮数据集上进行了实验，结果显示其在多轮意图分类任务上取得了最先进的性能。与现有方法相比，LARA平均提高了3.67%的准确率，并且在ICL期间减少了推理时间。LARA在处理复杂多轮对话中的有效性，并展示了其在实时应用中的适应性。

LARA的性能与基线相比，平均值是根据每个市场中测试样本的数量加权计算的。每个数据集的最佳性能用粗体表示，而次佳性能用下划线表示。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部