我要投稿

arXiv｜基于大型语言模型的电力调度：以用户为中心的方法

发布日期：2024-07-15 14:45:23 浏览次数： 2307 作者：电力学人

1. 首次提出利用大型语言模型（LLMs）将用户的任意语音请求转换为电力调度向量，开创了用户驱动的电力管理新方法。
2. 设计了新颖的三级代理架构，包括意图识别、参数识别和优化问题求解，实现了从语音请求到电力调度的端到端解决方案。

2024年6月，arXiv预印本平台发表了一篇题为"Large Language Models for Power Scheduling: A User-Centric Approach"的研究论文。该文提出了一种新颖的用户驱动电力调度方法，首次将大型语言模型（LLMs）应用于将用户语音请求转换为电力调度向量。研究设计了一个创新的三级代理架构，包括LLM意图识别代理、LLM参数识别代理和LLM优化问题求解代理，实现了从用户语音请求到具体电力调度策略的端到端解决方案。论文通过电动汽车充电案例验证了该方法的有效性，构建了包含800个语音请求的数据库，并深入探讨了提示工程技术、优化问题类别数量和LLM模型选择对系统性能的影响。引言

随着复杂系统的快速演进，高效管理系统资源以满足特定需求的复杂调度方案变得日益重要。传统算法通常被设计用于满足与特定系统相关的预定义约束。虽然它们在许多场景中已证明有效，但在面对用户动态和个性化需求时往往表现不佳。

传统方法不仅可能无法满足日益面向用户需求的服务所要求的体验质量（Quality-of-Experience，QoE），而且在个性化场景中可能导致高复杂性，并不一定能得到能源效率最优的解决方案。以能源管理为例，这是许多系统（包括无线通信网络、自动驾驶车辆系统、智能电网等）可靠和可持续运营的关键方面，人类在很大程度上仍然处于决策循环之外。例如，对于供暖或空调系统，人类通常只提供目标温度，而先进的调节算法完成其余工作。这种方法独立于个人用户偏好或能源可用性或成本的潜在变化而运行。因此，它可能并不总是优化能源效率或用户舒适度，显示出明显的局限性。

人类和算法之间存在这种脱节的原因有两个。首先，大多数人无法以数学建模现实世界问题并解决它，这就是为什么算法通常被赋予做出大多数决策的任务。其次，人类无法轻易或根本无法与算法、机器或程序进行沟通。然而，先进自然语言处理（Natural Language Processing，NLP）工具（如大型语言模型，Large Language Models，LLMs）的出现正在彻底改变这一范式。特别是，LLMs能够实现直观有效的人机交互，将复杂基础设施（如能源和无线网络）的运营转变为更具响应性和以用户为中心的解决方案。

研究目标与方法

2.1 研究目标

本研究的主要目标是利用LLMs的能力，使机器能够将人类用户的语音请求（Voice Request，VRQ）转换为电力调度向量。例如，对于本文考虑的案例（即电动汽车充电），这样的请求可以是："明天早上6点为我的电动汽车充电，同时管理其电池寿命"。对于手机，它可能是"调整你的发射功率以最小化电磁暴露，同时确保我的短信始终能发送出去"。

2.2 研究方法

本文引入并开发了一种新颖的电力调度方法，即利用LLM在预训练和辅助指令过程中获得的知识来建模和解决手头的问题。值得强调的是，虽然我们为特定的电力调度问题开发了这种方法，但这种方法可以推广到帮助人类利用数学建模、推理和解决能力来解决广泛的现实世界问题。

2.2.1 多代理架构设计

研究提出了一种新颖的多代理架构，以将用户的语音请求转换为电力调度向量。该架构包括三个主要组件：LLM意图识别代理（Agent 1）负责将用户请求分类为适当的优化问题（Optimization Problem，OP）类型；LLM OP参数识别代理（Agent 2）从用户请求和系统知识中提取所需的参数信息；LLM OP求解代理（Agent 3）利用外部求解器和LLM辅助来解决建模的优化问题。图1展示了这种多代理架构的设计。

2.2.2 性能评估指标

为了评估所提出架构的性能，研究定义了两个主要指标：意图识别准确率（Intent Recognition Accuracy，IRA）和平均相对最优性损失（Average Relative Optimality Loss，AROL）。IRA假设存在对给定数据库中每个VRQ的完美人工标注，对应于LLM分类器正确分类OP的经验百分比。AROL考虑到可能发生错误分类，衡量链Agent 1 → Agent 2 → Agent 3提出的功率向量平均有多次优。

2.2.3 实验设计

研究构建了一个包含800个可能用户VRQ的数据库，涵盖不同类型的电动汽车充电问题。这些请求分为显式和隐式两类，以评估系统处理不同表达方式的能力。此外，研究还探讨了不同提示工程技术对系统性能的影响，包括基本提示、上下文化提示和错误信息提示。

主要研究发现

3.1 提示工程技术的影响

实验结果表明，错误信息提示在所有性能指标中都达到了最高的IRA。通过提供典型的电动汽车充电问题，上下文化提示相对于基本提示显示出适度的改进，而后者与应用无关。图3展示了不同提示工程技术对Agent 1在IRA方面的影响。

图4进一步证实了这些结果，错误信息提示表现出最低的平均最优性损失，表明最准确的问题建模。这两个图证实了在底层框架中利用先进提示技术的优势，以显著提高模型准确分类请求的能力，并在最终充电功率向量方面引入改进的准确性性能。

3.2 优化问题类别数量的影响

研究发现，提供给分类器的OP类别数量对IRA性能有显著影响。结果显示，虽然有限数量的OP类别限制了可处理的请求数量，但增加更多OP类别会对IRA产生负面影响。这强调了详细和明确的用户请求对实现更高分类准确性的重要性。图5展示了不同OP类别集合对Agent 1选择最合适OP类别能力的影响。

此外，图6探讨了所选OP集对Agent 1的影响。IRA随不同OP分类数绘制，请求类别的分布也有所不同。当请求在所有类别中均匀分布时，使用较大的OP分类数显著提高了IRA。这表明精心设计的提示可以有效处理更广泛的类别，从而提高分类准确性。当请求主要来自一个类别时，较小的分类数可能会产生更好的IRA。

3.3 LLM模型选择的影响

研究比较了不同LLM模型（包括GPT-4o、Gemini Advanced 和Llama 3 70B）在OP分类任务中的性能。结果表明，更复杂/更大的LLMs有潜力改善OP分类。这进一步表明所提出的框架适用于大多数流行的LLMs，强调了该提出架构的通用性。表2展示了不同LLM模型对准确率（IRA）的影响。

3.4 电力调度向量模式

对于不同类型的请求，作者观察到了不同的电力调度向量模式。对于充电成本最小化请求，充电功率主要分配到电价较低的时间段。对于充电时间最小化请求，功率向量更集中在开始时段，而不考虑其他指标。对于功率峰值最小化请求，充电功率在非灵活负载较低的时间段较高，以平衡整体电力负荷。图7展示了为不同类别的语音请求（CC、CT、PP）生成的最终电力调度向量，与基本恒定功率充电策略进行了比较。这些结果证明了所提出方法在应用于电动汽车充电时的有效性：用户的语音请求被转换为非常适合各种请求（800个）的电力调度策略。

结论与展望

首次提出了如何利用LLMs将任意VRQ转换为电力向量，开发了一种新方法来设计电力管理系统的调度方案，其中系统需求通过用户的VRQ获取。提出了一种新颖的架构，包括设计3个LLM代理，以执行用户驱动的电力调度：意图识别代理、参数识别代理和OP求解代理。这些代理分别负责根据用户的VRQ识别数学问题的最佳建模、从VRQ和物理系统确定OP所需的参数，以及通过求解函数库解决建模的问题，其中LLM代理通过特定提示在初始化阶段协助求解器。

为了评估框架的性能，研究构建了一个用户VRQ相关电动汽车充电的数据库，包括相应的请求复杂度、基础事实OP/OCP类别和最优解。这个数据库使我们能够通过将生成的结果与这些基准进行比较来评估框架的性能，使用意图识别准确率（IRA）和最终效用。提出的架构展示了在电动汽车充电应用中的有效性，用户的语音请求被转换为适合各种请求的电力调度策略。

未来研究方向包括改进建模物理问题的代理设计，通过拥有更多样化的OP集并针对无线/能源网络进行微调；提升解决所选OP的代理性能，通过更好地结合标准OP求解器的能力与创造性的基于LLM的求解器；探索该方法在其他领域的应用，如无线通信网络的资源分配问题；研究如何进一步提高LLM在数学建模和问题求解方面的能力，以处理更复杂的优化问题；以及调查用户体验和系统性能之间的权衡，开发更适应用户偏好的动态调度策略。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

arXiv｜​​​​基于大型语言模型的电力调度：以用户为中心的方法

arXiv｜基于大型语言模型的电力调度：以用户为中心的方法