我要投稿

融合知识图谱与大模型的Agent策略

发布日期：2024-06-28 17:48:27 浏览次数： 2768

作者：思源智谱

微信搜一搜，关注“思源智谱”

随着人工智能技术的不断演进，语言代理Agent在处理复杂问题方面的角色变得愈发关键。这些代理依托于大型语言模型（LLMs），并通过任务分解、反思机制、协同工作分配以及外部工具的整合等多种策略来提升其任务规划的效能。尽管现有的提示技术在一些闭源语言模型中显示出良好的规划能力，但这些技术的应用往往受到模型固有认知能力和训练知识范围的限制。面对问答、网络信息检索、机器人操作等多个领域的广泛应用需求，通常通过Agent Tuning来提升模型的适应性和性能。这一过程涉及通过合成任务相关的轨迹来对模型进行微调，使其能够采取一系列高效的动作来完成特定任务，进而增强其在复杂环境下的适应能力。

然而，即使在开源模型中，执行规划任务依旧面临挑战。模型有时会产生与既定知识规则或常识相违背的计划，我们将这种现象称为“规划幻觉”。这一术语揭示了模型可能会生成不必要或相互冲突的动作序列，例如“未进行搜索即尝试检索信息”或“未确认桌子和苹果的存在即尝试从桌上取苹果”。

https://arxiv.org/abs/2403.03101

KnowAgent，旨在通过整合外部行动知识来优化合成轨迹，以减少规划幻觉的发生（参见上图）。该方法主要由三个关键步骤构成：首先，建立一个涵盖特定任务行动规划知识的广泛行动知识库，作为模型动作生成的参考；其次，将行动知识转化为文本形式，以便模型能够在创建行动轨迹时深入理解和运用这些知识；最后，通过一个知识驱动的自学习阶段，利用模型迭代过程中生成的轨迹来不断优化其对行动知识的理解和应用。这一过程不仅增强了代理的规划能力，也提升了它们在复杂环境中的应用潜力。

1.KNOWAGENT的总体框架

https://arxiv.org/abs/2403.03101

1.1 行动知识

在探讨行动知识的定义及其在大型语言模型（LLMs）中的作用时，我们首先明确了几个关键概念。

行动，在这里指的是大型语言模型（LLMs）为达成特定目标所必需执行的一系列独立动作。

行动规则，是对模型内部动作转换逻辑和次序的规定，它们明确规定了合法的动作转换，这些转换依据动作间的关系或特定任务的需求而定。

行动知识，则是一个综合概念，它包含了一系列明确定义的行动及其转换规则，()。针对不同任务的行动知识集合构成了行动知识库，简称行动KB。

https://arxiv.org/abs/2403.03101

1.2利用行动知识生成规划路径

如何运用行动知识来生成规划路径，涉及以下2个方面：

行动知识到文本的转化。如上图所示，这一过程始于识别与特定任务紧密相关的行动，并借助先前数据集分析和LLMs的内建知识，构建起行动知识库。接着，这些宝贵的信息被转换成文本格式，以便于模型进行后续处理。以HotpotQA（Yang et al., 2018）为例，引入一条行动规则：“搜索：（搜索，检索，查找，完成）”，这表明从搜索出发，有多条可行的路径可供选择，行动可以延续搜索本身，或者演变为检索、查找，直至达成任务的完成。
路径生成。该阶段是模型运用已转化行动知识的阶段，旨在简化任务的规划流程。模型依据行动规则来构建一条逻辑连贯的规划路径。