微信扫码
与创始人交个朋友
我要投稿
2022 年,一个叫 Jason Wei 的中国科学家,在一篇文章里首次提出了一个新观点:他认为,通过一种叫做 CoT(思维链) 的方法,可以让大型语言模型(LLM)在思考问题时,变得更加聪明和有逻辑。
但是即便有了 CoT(思维链),LLM 有时候还是会犯错。
去年,来自普林斯顿大学和 Google DeepMind 研究人员提出了一种全新的语言模型推理框架 -- ToT(思维树)。
该框架针对 CoT(思维链) 进行了总结,引导大语言模型利用思维作为中间步骤来解决通用问题,从而解锁了更复杂的推理方式和更高质量的输出结果。
论文地址:https://arxiv.org/abs/2305.10601
ToT(思维树) 到底有什么价值呢?
它可以让大模型:
通过一句话来总结:让计算机在解决问题时,能够像人类一样,多角度思考,然后做出最合适的选择。
接下来,我们一起来看看它的基础原理以及实践案例~
有小伙伴可能会问,它是怎么做到可以像人一样思考,还可以自行挑选最佳方案的呢?
ToT(思维树)的实现方式主要分为以下几步:
我们来看下每一步是什么意思:
思维的分解(Decomposing Thought)是 思维树 (ToT)方法中的关键部分,用于提高模型在解决问题时的效率和准确性。它是将一个复杂问题拆解为一系列更小、更易于管理的子问题或思维步骤的过程。
想象你要搭一个很大的乐高城堡,如果一下子搭整个,可能会手忙脚乱。所以,我们先把城堡分成几个小部分,比如塔楼、城墙等,一部分一部分地搭,最后再把它们拼起来。
在利用大模型解决问题时,也是这么做的,把一个大问题拆成几个小问题,一个一个解决。
思维生成器 是一个发散思维的机制,它能够在面对特定问题时,产生多种不同的、潜在的思考路径,从而拓宽解决问题的途径和策略。
这就像是给模型一个“点子库”,让它在面对问题时,能想出很多不同的解决办法。
比如,如果是个写作问题,它可能会生成很多不同的故事开头;如果是个数学题,它可能会列出几种不同的解题方法。
在解决问题的流程中,状态评估器 扮演着关键的决策辅助角色,它协助模型对各种可能的解决方案或思考步骤进行有效性分析和进展评估。
这个就像是模型的私人助手,帮助它判断哪些解决办法看起来更靠谱,哪些不太行。
这样,模型就可以把精力集中在那些最有希望的解决办法上。
搜索算法是一组系统化的方法,用于在问题的思维空间内进行有序的探索,目的是为了发现可能的解决策略。
在 ToT(思维树)中,这些算法协助模型识别出在众多生成的思维路径中,哪些值得深入挖掘,哪些则可以被排除。
这就像是模型的 专家顾问 ,帮助它在所有可能的解决办法中,找到最好的那一个。
比如,有的专家会先探索所有容易想到的解决办法(广度优先搜索),而另一些则会深入探索一个看起来特别有希望的解决办法(深度优先搜索)。
假设现在有一家小型咖啡店位于城市郊区,有 5 年的建店历史,但是生意越来越差,将濒临倒闭,目前店主希望提高收入,改善目前的状况。
如果单纯靠店主自己思考,那可能方案存在很多漏洞,这时候,我们让 AI + 思维树的方法,让 AI 充当:市场销售专家、自媒体作家、咖啡店的店主、咖啡爱好者、国际资深咖啡品牌创始人 这五位角色。
让 国际资深咖啡品牌创始人 作为裁判,按照顺序帮我找到最好的方案。
提示词:
问题背景:一家小型咖啡店位于城市郊区,有 5 年的建店历史,但是生意越来越差,将濒临倒闭,目前店主希望提高收入,改善目前的状况。
假设有四位角色帮助解决问题:市场销售专家、自媒体作家、咖啡店的店主、咖啡爱好者。还有一个保持中立,负责决策和投票的角色:国际资深咖啡品牌创始人,不参与问题思考和发表。
请按照如下步骤逐个执行:
1. 四位角色都写下了他们思考这个问题的简要步骤,并与大家分享。国际资深咖啡品牌创始人此次不做任何决策。
2. 四位角色都写下了第一个步骤的具体内容,并与大家分享,国际资深咖啡品牌创始人为每个角色的思路进行打分,并淘汰分数最低的人,并说出理由。
3. 剩余的角色继续发表下一个步骤的具体内容,并与大家分享。国际资深咖啡品牌创始人负责继续淘汰此次思路最差的人,并说出理由。
4. 以此类推,最终得到完整的问题解决方案,并汇总出来。
我们看下 AI 生成的效果。
1、初始化提示词
2、得到四位角色的简要步骤
3、开始每个角色的方案阐述和裁判投票
4、得到最终方案
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-18
2024-07-02
2024-07-18
2024-07-09
2024-07-15
2024-08-14
2024-07-26
2024-07-10
2024-07-10
2024-06-22
2024-11-20
2024-11-13
2024-10-31
2024-10-29
2024-10-16
2024-09-19
2024-08-28
2024-08-24