AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


进化中的AI提示优化:从猴子打字到微分优化
发布日期:2024-06-21 07:12:32 浏览次数: 1697


 预测未来的最好方法就是去创造未来。-- 彼得·德鲁克




01

如何给数字排序?


假设我们有100个数,如何把它们从小到大排列呢?计算机背景的人可能已经想到很多答案,比如冒泡排序、归并排序、快速排序等。但你知道有一种更加通俗易懂的排序方法吗?那就是Bogo排序。


Bogo排序的工作方式很简单却荒谬:随机生成一个排列,然后检查从第一个数开始检查,看是否后面的数比它大。如果没有,就再次随机生成一个排列,如此循环,直到最终排列正确。这种方法不仅效率极低,而且没有任何方向性,就像猴子在打字机上胡乱敲击,试图偶然敲出一篇莎士比亚的剧本。


Bogo排序算法的效率纯靠运气


02


优化的迷宫:AI提示工程的困境


LLM(大型语言模型)的提示优化似乎还处于类似Bogo排序的阶段。大多数情况下,我们会尝试设计出几个不同的提示,然后进行评估,选择结果最好的那个这种启发式的方法不仅效率低下,还极具随机性,无法保证找到最优解。优化(Optimization)和评测(Evaluation)在这种情况下似乎是各干各的,缺乏有效的联动。随着优化的难度越来越大,这种拍脑袋的优化方法将会越来越艰难。


03


优化闭环的初步形成


随着技术的发展,我们已经看到了改变这一现状的希望。斯坦福大学自然语言研究组提出了一个叫DSPy的框架(论文题目《DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines》,详情见https://arxiv.org/pdf/2310.03714)。这个框架引入了一种针对特征工程的Domain-Specific Language (DSL),使基于提示工程的优化更加系统化。



乍一眼看去,这个框架的风格和PyTorch很相似。用户可以像写正常的python语言那样进行开发。比如一个思维链可以写成下面这个样子:



基于这个框架的系统可以自动化Few-Shot学习的方法。通过对提示的自动优化,使得提示工程的过程不再像Bogo排序那样毫无方向。尽管Dspy的优化仍然属于离散优化或网格搜索的层面,但它通过形成自我改进的管道,使系统优化变得更加高效和系统化。


04


Prompt的微分优化


我们如何实现更细粒度的优化呢?这正是TextGrad所要解决的问题。TextGrad展示了如何将深度学习中的微分优化应用到提示优化中。TextGrad(论文题目《TextGrad: Automatic "Differentiation" via Text》,详情见:https://arxiv.org/pdf/2406.07496)的工作方式让我想起了熟悉的PyTorch微分优化系统。


PyTorch文风很像,简直和PyTorch1.0版本之前的语法一模一样


通过定义一个目标函数,并计算每个提示的表现,我们可以使用梯度下降等优化算法,逐步调整提示,直到找到最佳解决方案。这种方法不仅提高了效率,还使优化过程更加科学和系统化。

就像神经网络利用基于微分和反向传播的优化方法,我们也可以将同样的方法应用到整个AI系统中,使其更加高效和智能。

然而,我们需要认识到,当前 TextGrad 中的差分优化过程仍然只是对真正数值优化的模仿。在这种情况下,损失函数来源于语言模型的输出,这意味着它不是纯粹的数值,而是文本质量的反映。这种内在的差异导致优化过程缺乏传统数值优化方法的可控性、可量化性和方向性


例如,TextGrad 中的损失函数(请参见代码:https://github.com/zou-group/textgrad/blob/main/textgrad/loss.py#L44-L52)显示,修正后的提示质量在迭代过程中可能会波动。这种波动表明了一个重要的改进领域。迭代过程可能会导致提示回到以前的状态,类似于梯度下降中“损失振荡”的概念。


返回的损失是LLM的修改建议,还不具有传统数值优化的可量化性以及方向性

通过 TextGrad 优化提示的过程展示了这一领域的激动人心的可能性。随着我们不断改进这些技术,未来我们可以期待使优化过程更加稳健、可量化和有方向性。持续改进和稳定提示质量的潜力是巨大的,我们刚刚开始解锁差分优化在提示优化中的全部能力。


05


逐渐成型:更系统化的AI系统迭代


从启发式到网格搜索,再到微分优化,AI提示优化的未来充满了无限可能。借鉴神经网络的优化策略,我们有望将这一领域带入一个全新的智能化时代,形成一个完整的闭环系统,实现自我优化和迭代。


我们正在见证AI提示优化从简单的试错方法,逐步转变为更加科学和系统化的过程。随着技术的不断发展,未来的AI系统将能够更好地理解和适应用户需求,提供更准确和高效的解决方案。这不仅将提高AI系统的性能,还将极大地提升用户体验。


此外,AI提示优化的发展也意味着我们可以更快地迭代和改进AI模型。通过不断的优化和调整,AI系统将变得越来越智能,能够处理更加复杂和多样化的任务。我们正迈向一个不再依赖随机尝试,而是通过科学方法进行优化的新时代。


06


写在最后

尽管目前AI提示优化仍处于初级阶段,类似于Bogo排序的随机尝试,但随着Dspy和TextGrad等工具的出现,我们已经看到了更高效、更智能的优化方法的曙光。通过形成反馈闭环和引入微分优化,我们正在逐步告别“猴子打字”的时代,迈向一个更加智能和高效的未来。


AI提示优化的进化不仅是技术上的突破,更是思维方式的转变。我们从随机尝试走向系统化、科学化的优化方法,正如从蒙昧时代迈向文明时代。这一进程将继续推动AI技术的发展,使我们的生活变得更加便捷和智能。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询