我要投稿

红杉资本行业总结篇：生成式 AI 的发展

发布日期：2024-10-13 07:06:05 浏览次数： 2069 作者：Datawhale

生成式 AI 的发展：从 “快思考” 到 “慢思考”，开启自主应用的新篇章。

在生成式 AI 革命的两年里，研究方向正从 “快思考”（快速预训练响应）向 “慢思考”（推理时的深度思考）转变。这种转变是因为市场基础层已趋于稳定，像微软 / OpenAI、AWS/Anthropic 等巨头形成了竞争格局。

随着大模型市场结构趋于稳定，下一个重点领域正在浮现：焦点正转向推理层的开发和扩展，“系统 2” 思维开始主导。

推理层旨在赋予 AI 系统在推理时进行深度思考、问题解决和认知操作的能力，而不仅仅是快速的模式匹配。它能让 AI 系统像人一样深度思考和解决问题。

OpenAI 的 o1 模型：推理能力的突破

2024 年最重要的模型更新非 OpenAI 的 o1 莫属（之前称为 Q*，也被称为草莓，Strawberry）。它不仅巩固了 OpenAI 的领先地位，更是首个具备真正通用推理能力的模型，o1 通过“推理时计算”实现了这一点。

通常预训练模型是在海量数据上进行下一个词元的预测，它们依赖的是“训练时计算”。与传统预训练模型依赖 “训练时计算” 不同，o1 模型则是主动的推理，在回答之前先 “停下来思考”。

那么，当 o1 停下来思考时，它在做什么？

2016 年的 AlphaGo 与李世石的对决是深度学习的重要事件——这是世界看到 AI 不仅仅只是在模仿模式的时刻，它在思考。

AlphaGo 不同于依赖预训练快速反应的模型，它从围棋数据库学习并自我对弈进化，在推理时模拟评估场景选择最佳方案。随着推理时间的增加，AlphaGo 的表现越来越好——直到它超越了最优秀的人类。

而大语言模型复制 AlphaGo 的难点在于构建价值函数，即如何为模型的回答打分。o1 模型的关键思想是通过模型生成的思维链进行强化学习，这和人类的思维和推理方式比较相似。

“强化学习很重要，它正为 AI 开启全新的推理能力层。”

Datawhale 强化学习开源教程：https://github.com/datawhalechina/easy-rl

AI 思维模式的转变：从系统 1 到系统 2 及新扩展法则

AI 正从简单的预训练反应（“系统 1”）向更深层次的更加深思熟虑的推理（“系统 2”）转变。

系统 1 依赖模式模仿，不论是 AlphaGo 通过围棋的数百万步训练出的技能还是大语言模型通过大量的互联网文本进行预训练所训练出的语言能力。但是，模仿，尽管强大，却不是真正的推理。

面对复杂新问题，系统 2 的深度推理至关重要。它要求 AI 探索多种可能，评估结果并基于逻辑推理决策，以应对复杂问题。

从 o1 论文得到的最重要见解是，出现了一种新的扩展法则。

预训练大型语言模型遵循投入的计算和数据越多性能越好的法则，而 o1 论文开启了给予推理时间（或“测试时间”）的计算越多推理能力越强的新方式。

这种转变将推动从预训练集群向推理云环境的转变，为 AI 发展带来新机遇。

随着 OpenAI、Anthropic、谷歌（Google）和 Meta 不断扩展推理层，开发出更强大的推理机器，会发生什么？我们会迎来一个主导一切的“超级模型”吗？

应用层公司已从基础模型上的简单界面发展为构建复杂认知架构。包括多个基础模型、路由机制、数据库用于 RAG，以及合规和模仿人类思考的逻辑。

投资方向的分析：各层面的机遇与挑战

作为全球著名风投公司，红杉资本更关注哪里？资金被投入到哪里？

基础设施：基础设施层面是超大规模企业的优势领域，对风险投资家来说不好。
模型：模型层面是超大规模企业和金融投资者的竞争领域。
开发者工具和基础设施软件：对战略投资者吸引力较小，对风险投资家较有吸引力。
应用程序：应用程序层面是风险投资者最感兴趣的，云过渡和移动过渡期间有应用层公司年收入超 10 亿美元，预计 AI 领域也会如此。

未来展望

在生成式 AI 的下一个阶段，推理研发会对应用层产生重大影响。当前很多认知架构采用 “解锁” 技术，而未来这些能力会更深地融入模型，代理应用会更强大。

在研究实验室，推理和推断时间计算仍是重要主题，新的拓展法则开启了下一场竞争。

但收集特定领域真实数据和编码认知架构仍有难度，而最后一公里应用提供商在解决复杂现实问题上可能有优势。

考虑到未来，多智能体系统，如工厂的机器人，可能会开始普及，成为建模推理和社会学习过程的方式。

大家都在期待生成式 AI 的「第 37 步」，那一刻——就像 AlphaGo 在与李世石的第二场比赛时一样——一个通用人工智能系统以超出人类的方式，展现出类似独立思考的能力。

这意味这我们已经模拟了感知、推理和行动过程，能让 AI 以新颖有用的方式进行探索，这可能就是 AGI 吧。

等到那个时候，那一步棋将不是偶然事件，而只是技术的下一个阶段。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

10万元跑满血版DeepSeek，这家公司掀了一体机市场的桌子｜甲子光年

2025-04-29

谷歌大神首次揭秘Gemini预训练秘密：52页PPT干货，推理成本成最重要因素

2025-04-29

一文说清：什么是算法备案、大模型备案、大模型登记 2.0

2025-04-29

MCP：AI时代的“万能插座”，大厂竞逐的焦点

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

一站式AI应用开发平台 Firebase Studio

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

从MCP到超级Agent：这场AI生产力革命将淘汰谁？

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB