我要投稿

聊聊大模型采样策略

发布日期：2024-07-26 06:57:40 浏览次数： 2511

贪心搜索、波束搜索、Top-K采样、Top-p采样和温度都是影响LLM如何生成token的推理时参数，它们只是从离散概率分布中采样的方法，根据LLM输出的概率分布进行操作。

在Gradio中也是有这些常用的参数，而且合理的调参才有合适的输出。

Greedy search

Greedy search（贪婪搜索）是指在每个t时刻选择下一个词时，根据选择概率最高的词。

缺点：

由于每次都是寻找概率最高的词，因此很有可能会错过当前是低概率词后面的高概率词。即，只考虑当前的局部最优，而没有从整体的角度来考虑。

Beam search

Beam search（集束搜索）对贪心搜索进行了改进，扩大了搜索空间，更容易得到全局最优解。Beam Search 包含一个参数 beam size k，表示每一时刻均保留得分最高的 k 个序列，然后下一时刻用这 k 个序列继续生成。

从这里来看，该算法算是基于贪婪搜索的缺点来设计实现的。

缺点：

还是会产生局部最优问题。
在某些需要多样性的应用场景中，Beam Search可能会生成较为相似的答案，因为它倾向于选择评分最高的候选答案，这可能导致答案的多样性不足。

维特比算法能做到全局最优。

top-k采样

Top-K采样限制在一定数量要考虑的tokens。

在 Top-K 采样中，概率最大的 K 个词会被选出，然后这 K 个词的概率会被重新归一化，最后就在这重新被归一化概率后的 K 个词中采样。

top-p采样

Top-p采样限制在一定概率质量内的tokens。

temperature

其作用如下：

温度不是采样策略，而是softmax函数的参数，该函数是网络的最后一层。
温度影响概率分布的形状。
高温使token分布概率更加接近，也就是概率较低的token可能会出现。这使得输出更加“有创意”或随机。
低温通过放大概率差异使模型更加“确定”。这使得输出更具确定性。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-14

Google GenAI Processors：重新定义实时AI开发架构

2025-07-14

月费200刀的AI浏览器，Perplexity Comet的真实体验如何？

2025-07-14

一文吃透Dify：Chatflow与Workflow的深度对决

2025-07-14

首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

2025-07-14

有创始人开始收“尽调误工费”了

2025-07-14

一文讲清楚大模型中8个关键词及原理：LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

2025-07-14

Anthropic官方：Claude Code - 安装配置手册

2025-07-14

不用AI，可能永远造不出新一代动力电池｜甲子光年

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

高效 Agents 构建指南

2025-05-23

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

一文实测Gemini 2.5 Pro：视频驱动的代码生成，打造交互式开发应用新范式

2025-05-07

豆包，让有独立显卡的电脑都能部署本地大模型，语料库就是电脑里的文件

2025-04-17

大家都在问

月费200刀的AI浏览器，Perplexity Comet的真实体验如何？

2025-07-14

智能体Agent这场风暴还能刮多久？

2025-07-14

从机器人三定律说起：当AI遇上道德难题，我们该如何选择？

2025-07-14

初次上手如何快速开发基于大模型+function call的agent应用？

2025-07-14

万维钢：怎么把AI使用到最高水平？

2025-07-14

从"猜配件"到"秒匹配"：AI Agent如何让万亿汽配市场告别石器时代？

2025-07-14

Auto Agent：气宗还是剑宗？——Workflow 还是强大模型？

2025-07-13

“内卷”到向量空间：Qwen3-Embedding 是真香还是跟风？

2025-07-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB