AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


吴恩达老师 AI 代理工作流程的四种设计模式之一:反思
发布日期:2024-04-08 17:14:25 浏览次数: 1889


上周,我描述了 AI 代理工作流程的四种设计模式,我相信它们将在今年推动重大进展:反思、工具使用、规划和多智能体协作。代理工作流不是直接LLM生成最终输出,而是多次提示,LLM使其有机会逐步构建更高质量的输出。在这封信中,我想讨论一下反思。对于实现速度相对较快的设计模式,我已经看到它带来了令人惊讶的性能提升。

你可能有过这样的经历:提示 ChatGPT/Claude/Gemini,收到不满意的输出,提供关键反馈以帮助LLM改善其响应,然后得到更好的响应。如果您自动执行提供关键反馈的步骤,以便模型自动批评自己的输出并改进其响应,会怎么样?这是反思的关键所在。

以要求一个LLM 编写代码为任务。我们可以提示它直接生成所需的代码来执行一些任务 X。之后,我们可以提示它反思自己的输出,可能如下:

下面是用于任务 X 的代码:[以前生成的代码]

仔细检查代码的正确性、风格和效率,并就如何改进它提出建设性的批评。

有时这会导致LLM发现问题并提出建设性的建议。接下来,我们可以提示上下文,LLM包括 (i) 先前生成的代码和 (ii) 建设性反馈,以及 (iii) 要求它使用反馈重写代码。这可以带来更好的响应。重复批评/重写过程可能会产生进一步的改进。这种自我反思过程允许发现LLM差距并改进其在各种任务上的输出,包括生成代码、编写文本和回答问题。

我们可以通过提供有助于评估其产出LLM的工具来超越自我反省;例如,通过一些单元测试运行其代码,以检查它是否在测试用例上生成正确的结果,或者搜索 Web 以仔细检查文本输出。然后,它可以反思发现的任何错误并提出改进的想法。

此外,我们可以使用多智能体框架实现 Reflection。我发现创建两个不同的智能体很方便,一个提示生成良好的输出,另一个提示对第一个智能体的输出提出建设性的批评。由此产生的两个代理之间的讨论导致了改进的响应。

反思是一种相对基本的代理工作流类型,但我很高兴它在一些情况下改善了我的应用程序的结果。我希望你能在自己的工作中尝试一下。如果你有兴趣了解更多关于反思的知识,我推荐这些论文:

  • “自我细化:自我反馈的迭代细化”,Madaan 等人,2023 年

  • “反思:具有言语强化学习的语言代理”,Shinn 等人,2023 年

  • “批评家:大型语言模型可以通过工具交互式批评进行自我纠正”,Gou 等人,2024 年


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询