微信扫码
与创始人交个朋友
我要投稿
在大型语言模型(LLM)的领域中,"Chain-of-Thought"(CoT)是一种新兴的提示技术,它通过模拟解决问题的思考过程来提高模型生成内容的质量和相关性。CoT的概念源自于人类解决问题时的思维模式,即通过一系列逻辑步骤来逐步推导和解决问题。
CoT提示技术要求模型在生成答案之前,先展示其思考过程。这不仅仅是直接给出答案,而是包括了推理、分析和解释的步骤。CoT可以促使模型更深入地理解问题,并提供更全面、更有逻辑性的回答。
CoT对LLM生成内容的影响主要体现在以下几个方面:
通过CoT,模型能够生成更准确、更详细的答案,因为它需要展示其推理过程,这有助于避免生成模糊或错误的信息。
CoT要求模型在生成内容时保持逻辑性和连贯性,因为它需要按照一定的顺序展示其思考过程。
当用户看到模型的推理过程时,他们更有可能信任模型提供的答案,因为这些答案看起来更加透明和可解释。
CoT可以作为一种教育工具,帮助用户理解复杂概念和解决问题的方法。
让我们通过一个数学问题的例子来说明CoT的应用:
假设问题是:“一个长方形的长是宽的两倍,如果它的周长是20厘米,那么它的长和宽分别是多少?”
没有CoT:模型可能直接给出答案:“长是8厘米,宽是4厘米。”
使用CoT:模型会展示其思考过程:
我们知道长方形的周长是长和宽的两倍之和。
设宽为 ,长为 。
周长公式为 =20 厘米。
简化得到 。
解得 厘米,约为3.33厘米。
长为 厘米,约为6.67厘米。
通过CoT,模型不仅给出了答案,还展示了如何通过逻辑推理得到答案。那在写提示词的时候,应该如何写呢?看下面这个例子。
我用chatgpt3.5-turbo来演示下实际的效果,问题是选择哪种交通出行的方式,能够最快到达公司。
如果不使用CoT,模型直接告诉你,用哪个选项。如果使用CoT的模式,你的提示词,需要给出推理的样本,类似one-shot、few-shots,模型也同样地,会反馈给你推理的过程:
# 不使用Cot:
提示词:
Which is a faster way to get to work?
Option 1: Take a 1000 minute bus, then a half hour train, and finally a 10 minute bike ride.
Option 2: Take an 800 minute bus, then an hour train, and finally a 30 minute bike ride.
模型输出:
Option 1 is a faster way to get to work.
# 使用CoT来优化答案,让模型解释推理的过程
提示词:
Which is a faster way to get home?
Option 1: Take an 10 minutes bus, then an 40 minute bus, and finally a 10 minute train.
Option 2: Take a 90 minutes train, then a 45 minute bike ride, and finally a 10 minute bus.
Option 1 will take 10+40+10 = 60 minutes.
Option 2 will take 90+45+10=145 minutes.
Since Option 1 takes 60 minutes and Option 2 takes 145 minutes, Option 1 is faster.
Which is a faster way to get to work?
Option 1: Take a 1000 minute bus, then a half hour train, and finally a 10 minute bike ride.
Option 2: Take an 800 minute bus, then an hour train, and finally a 30 minute bike ride.
模型输出:
Option 1 will take 1000+30+10 = 1040 minutes.
Option 2 will take 800+60+30 = 890 minutes.
Since Option 2 takes 890 minutes and Option 1 takes 1040 minutes, Option 2 is faster.
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-01
2024-08-13
2024-04-25
2024-04-26
2024-03-30
2024-07-25
2024-05-10
2024-05-28
2024-04-12
2024-05-06