我要投稿

AIGC时代如何发挥你的知识？用知识图谱增强大语言模型

发布日期：2024-06-21 10:13:24 浏览次数： 2609

作者：思源智谱

微信搜一搜，关注“思源智谱”

以ChatGPT作为大型语言模型(LLM)的代表的生成式人工智能——AIGC（Artificial Intelligence Generated Content）因其强大的语言理解与生成能力而备受关注。一些研究人员认为，大语言模型LLM（Large language model）有可能取代结构化知识库，如知识图谱(KGs)，并作为参数化知识库发挥作用。然而，尽管大型语言模型能够熟练地学习基于大型语料库的概率语言模式，并与人类进行对话，但在生成基于知识的内容时，在回忆事实方面仍然存在困难。为了克服这些限制，研究人员提出用基于知识的KGs增强数据驱动的LLM，将明确的事实知识整合到LLM中，从而提高LLM生成需要事实知识的文本的性能，并为用户查询提供更明智的响应。

1.基本定义111111111

知识图谱KGs，是一种先进的知识库架构，它通过图形化的方式呈现和存储知识，其核心构成单元是三元组，即由两个实体及其之间关系组成的结构（头实体-关系-尾实体）。这一概念源自于语义网络，但与传统的语义网络相比，知识图谱更加丰富，不仅涵盖了实体、关系及其属性，还深入描绘了实体间关系的语义层面。知识图谱采用了一种符号化的方法来编排和展示知识，这种方法使得计算机能够理解事物的本质及其相互间的关联，从而实现高效的信息检索和复杂的逻辑推理。

大模型LLM，在人工智能的语境中指的是那些拥有极其庞大的参数量和数据处理能力的神经网络结构。这些模型通过摄取大量的文本或多模式的数据，不断提升其语言理解和模式识别的能力，从而能够更有效地解读和操作自然语言，甚至能够创作出全新的文本内容。特别地，当我们提及大型语言模型时，我们所指的是那些拥有数十亿到数万亿参数的模型，它们通过处理数万亿级别的词元数据进行训练，构建起了极其复杂的深度神经网络。

(1)知识图谱KGs与大模型LLM优缺点总结

http://xblx.whu.edu.cn/previewFileid=58539306&type=pdf&lang=zh

(2)大模型LLM应用-ChatGPT

大模型LLM最引人注目的应用是ChatGPT，它采用GPT-3.5进行对话，展示了惊人的对话能力。ChatGPT的实现过程如下图：

https://ieeexplore.ieee.org/document/10417790

首先在大规模语料库上训练GPT，然后在标注器演示的数据集上对其进行微调。之后，使用RLHF优化模型，RLHF训练奖励模型从人类评估者提供的直接反馈中学习，并通过将GPT模型表述为强化学习问题来优化GPT模型。在这种设置中，预训练的GPT模型作为策略模型，将小块提示作为输入，并返回输出文本。然后，针对奖励模型，使用近端策略优化(PPO)算法对GPT策略模型进行优化。ChatGPT基于RLHF方法，使GPT能够遵循人类的预期指令，减少有毒、偏误和有害内容的产生。此外，ChatGPT采用了思维链策略，并对代码数据进行了额外的训练，使其能够解决需要中间逻辑步骤的任务。

2.基于知识的KGs增强数据驱动的LLM

LLM在记忆大量复杂知识和准确检索所需信息方面仍然面临挑战。另一方面，KGs和LLM相辅相成，提高了整体绩效。因此，用KGs增强LLM可以显著提高他们在知识型任务上的表现。KGLLM的总体技术框架如下图：

https://ieeexplore.ieee.org/document/10417790

针对如何有效地将结构化知识（如KGs）整合到LLM中，以及如何改进LLM的事实推理能力的问题，当前主要有三种整合KGs和LLM的KGLLM方法。

https://ieeexplore.ieee.org/document/10417790

（1）训练前增强KGLLM。可用于构建KG扩展文本，提高输入质量并将事实信息整合到输入中。

（2）训练过程增强KGLLM。可以自适应地融合文本知识和结构知识，学习知识增强的词表示。

（3）训练后增强KGLLM。可用于通过在知识扩展数据或基于知识的任务上对LLM进行微调，进一步提高LLM在某些特定领域任务上的性能。

在提示学习中，为特定任务选择合适的提示模板对于提高模型性能至关重要，这需要领域专业知识。因此，可以将KGs集成到构建提示模板中，利用领域知识，通过知识提示指导LLM，提高模型对领域事实知识的理解。

3.总结

随着ChatGPT的成功掀起了大型语言模型（LLM）的研究热潮，学术界和工业界的目光聚焦于这些模型是否能够蜕变为参数化的知识宝库，进而挑战传统知识库的地位。尽管LLM在多个自然语言处理（NLP）任务中的表现令人瞩目，但在准确回忆和运用事实知识方面仍显不足。

通过对知识图谱（KGs）和LLMs各自优势与局限性的深入剖析，以及对ChatGPT等大模型应用实现机制的细致解构，本文提出了一个综合性的KGLLM技术框架，并探索了三种有效融合KGs与LLM的创新方法。我们的目标是强化LLM与KGs之间的事实感知互动，提高模型对事实知识的学习与应用能力，为LLM与KGs的深度融合开辟新的道路。