支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


当模型取代应用:AI 行业的下一步是什么?

发布日期:2025-03-27 07:24:22 浏览次数: 1655 作者:Chilli同学
推荐语

AI模型将如何重塑应用层?揭秘AI行业未来趋势。

核心内容:
1. AI模型取代应用层的可能性探讨
2. AI模型能力增强与应用层自动化趋势
3. 模型作为产品的实际案例分析

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

今天想和大家分享一篇文章:《The Model is the Product》,探讨了 LLM 发展的一个可能趋势:AI 的未来在于模型本身,而非应用层。随着技术的进步,模型的能力越来越强大,能够直接满足用户需求,而无需依赖传统的应用层封装。

在全员追求 AGI 的当下,也许这篇文章也能够帮助你对一些知名公司的决策提供一个理解的方向。 

本人只对以下文章进行翻译及整理,观点仅供参考,不代表本人立场。

《模型即产品》 /

过去几年,关于人工智能下一阶段发展的猜测有很多:代理?推理者?真正的多模态?

我认为是时候明确指出:模型就是产品。

当前在研究和市场发展中的所有因素都在推动这个方向。

  • 通用型扩展正在停滞。这正是 GPT-4.5 发布背后的全部信息:能力呈线性增长,而计算成本呈几何曲线。即使在过去两年中训练和基础设施的效率提升,OpenAI 也不能以任何可负担的价格部署这个巨型模型。

  • 有偏见的训练效果比预期好得多。强化学习和推理的结合意味着模型突然开始学习任务。这既不是机器学习,也不是基础模型,而是一种秘密的第三种东西。即使是微小的模型也在数学方面突然变得可怕。编码模型不再只是生成代码,而是可以自己管理整个代码库。就像 Claude 在非常有限的主题信息和没有专门训练的情况下玩宝可梦。它是一种编码模型,不再只是生成代码,而是通过自己管理整个代码库。

  • 推理成本正在飞速下降。DeepSeek 的最近优化意味着所有可用的 GPU 都可以满足一个前沿模型每天 10k 令牌的需求……针对全球人口。这种需求水平无处可寻。出售令牌的经济模式对于模型提供商来说不再适用:他们必须向价值链的上层移动。

这也是一个不舒服的方向。所有投资者都押注在应用层。在人工智能演变的下一阶段,应用层很可能会是第一个被自动化和颠覆的。


1

   

即将到来的模型形态

在过去的几周里,我们已经看到了两个这一代模型作为产品的绝佳例子:OpenAI 的 DeepResearch 和 Claude Sonnet 3.7。

我读过很多关于 DeepResearch 的误解,这并不是因为开放的克隆和封闭的克隆的激增。OpenAI 并没有在 O3 上构建一个包装器。他们训练了一个全新的模型[2],能够内部执行搜索,没有任何外部调用、提示或编排:

该模型学会了核心的浏览能力(搜索、点击、滚动、解析文件)……以及如何通过在这些浏览任务上的强化学习训练,通过综合大量网站来找到特定的信息或撰写综合报告。

DeepResearch 不是一个标准的 LLM,也不是一个标准的聊天机器人。它是一种新的 研究语言模型,专门设计来执行端到端的搜索任务。对于任何认真使用它的人来说,这种差异是立即显而易见的:该模型会生成结构一致、底层源分析过程一致的冗长报告。相比之下,正如 Hanchung Lee 强调[3],所有其他的 DeepSearch,包括 Perplexity 和 Google 变体,都只是普通的模型,只是做了一些改变:

Google 的 Gemini 和 Perplexity 的聊天助手也提供了“深度研究”功能,但它们都没有发布任何关于它们如何优化模型或系统以完成这项任务或任何实质性定量评估的文献……我们将做出假设,所进行的微调工作并不重要。

Anthropic 已经越来越清晰地阐述了他们的当前愿景。12 月,他们介绍了一个有争议但在我看来是正确的定义[4] 的代理模型。与 DeepSearch 类似,代理必须在内部执行目标任务:它们“动态地指导自己的流程和工具使用,保持对完成任务方式的控制”。

目前大多数代理初创公司正在构建的不是代理,而是工作流程,即“LLM 和工具通过预定义的代码路径编排的系统”。工作流程可能仍然带来一些价值,特别是对于垂直适应。然而,对于目前在大实验室工作的任何人来说,显而易见的是,所有自主系统的主要进步都将通过首先重新设计模型来实现。

我们通过 Claude 3.7 的发布看到了一个非常具体的例子,这是一个主要针对复杂代码使用案例进行训练的模型。所有的工作流程适应,如 Devin 在 SWE 基准测试中获得了重大提升。

以另一个规模较小的例子为例:在 Pleias,我们目前正在自动化 RAG。当前的 RAG 系统是一系列相互连接但脆弱的工作流程:路由、分块重排序、查询解释、查询扩展、源上下文化、搜索工程。随着不断发展的训练技术堆栈,真正有可能将所有这些流程捆绑在两个单独但相互关联的模型中,一个用于数据准备,另一个用于搜索/检索/报告生成。这需要精心设计的合成管道和全新的强化学习奖励函数。真正的训练,真正的研发。

实际上,这一切意味着消除复杂性。训练预见了广泛的动作和边缘情况,从而使部署变得简单得多。但在这一过程中,大部分价值现在是由模型训练者创造和捕获的。简而言之,Claude 旨在颠覆和取代当前的工作流程,就像这个 llama index 的基本“代理”系统:

Llama Index Basic Agent

用这个:

Claude Agent


2

   

训练还是被训练

重申:大实验室并不是在秘密地推进。虽然他们有时可能会显得模糊不清,但他们将所有东西都公之于众:他们将捆绑,他们将进入应用层,并将试图在那里捕获大部分价值。商业后果非常明显。Databricks 通用人工智能副总裁 Naveen Rao 非常恰当地表达了[5]:

所有封闭的 AI 模型提供商将在未来 2-3 年内停止销售 API。只有开放模型将通过 API 提供服务(……)封闭模型提供商正在试图建立非商品化能力,他们需要伟大的 UI 来交付这些。这不仅仅是一个模型,而是一个具有 UI 的应用程序,用于特定的目的。

所以,现在正在发生的一切只是很多否认。模型提供商和包装器的蜜月期已经结束。事情可能向两个方向发展:

  • Claude Code 和 DeepSearch 是这一方向早期技术和产品实验。你会发现 DeepSearch 不是通过 API 提供的,只用于为高级订阅创造价值。Claude Code 是一种简约的终端集成。奇怪的是,尽管 Claude 3.7 在 Claude Code 中运行得非常好,Cursor 仍然很困难,我已看到一些高端用户因此取消订阅。实际的 LLM 代理根本不关心现有的工作流程:它们取代它。

  • 最知名的包装器现在正忙于成为混合 AI 训练公司。他们确实有一些训练能力,尽管很少宣传。Cursor 的主要资产是它的小型自动补全模型。WindSurf 有他们自己的低成本代码模型 Codium。Perplexity 一直依赖于家分类器进行路由,最近转向训练自己的 DeepSeek 变体以进行搜索。

  • 对于较小的包装器,不会有太大的变化,除非大实验室完全放弃这个市场,他们可能会更依赖无差别的推理提供商。我还预计会看到对 UI 的更多关注,因为 UI 仍然被严重低估,因为即使是一般化的模型也可能捆绑常见的部署任务,特别是对于 RAG。

简而言之,大多数成功的包装器的困境很简单:训练还是被训练。他们现在正在做的事情既是为大实验室进行免费市场研究,也是免费的,因为所有输出最终都是通过模型提供商生成的,免费的数据设计和生成。

之后会发生什么,谁也不知道。成功的包装器确实有了解他们的垂直领域的优势,并积累了大量的宝贵用户反馈。然而,根据我的经验,从模型到应用层比从头开始构建全新的训练能力要容易得多。包装器可能也没有得到他们的投资者的帮助。据我所知,人们对训练存在一种负面的两极分化,他们几乎不得不隐藏他们最关键的价值:cursor 小型和 codium 都没有得到适当的记录。


3

   

强化学习尚未定价

这让我想到了真正痛苦的部分:目前所有的 AI 投资 都是相关的。基金在以下假设下运营:

  • 真正的价值完全在于一个独立于模型层的应用层,该层最适合颠覆现有市场。

  • 模型提供商将只以不断降低的价格出售令牌,从而使包装器变得更加有利可图。

  • 封闭模型包装将满足所有现有的需求,即使在监管领域,也存在长期对外部依赖的担忧。

  • 建设任何训练能力都是浪费时间。这不仅包括预训练,还包括所有形式的训练。

我担心这越来越像是一场冒险的赌注,实际上是对最新技术发展的市场失败定价,特别是在强化学习领域。在当前的经济生态系统中,风险投资旨在寻找非相关的投资。他们不会打败 S&P500,但这不是大型机构投资者所寻求的:他们希望捆绑风险,确保在坏年景至少有一些事情会成功。模型训练就像教科书中的一个完美例子:在大多数西方经济体都在走向衰退的背景下,存在着颠覆的巨大潜力。然而,模型训练者却无法筹集资金,或者至少不是以通常的方式。Prime Intellect 是为数不多的几家新西方 AI 训练公司之一,有明确的潜力成为前沿实验室。然而,尽管他们取得了包括训练第一个去中心化 LLM 在内的成就,但他们却难以筹集更多的资金。

除此之外,除了大实验室,当前的训练生态系统非常小。你可以用手指头数出这些公司:Prime Intellect、Moondream、Arcee、Nous、Pleias、Jina、HuggingFace 预训练团队(实际上很小)……以及一些学术界的其他参与者(Allen AI、Eleuther……)。他们构建并支持了当前大多数开放基础设施的培训。在欧洲,我知道至少有 7-8 个 LLM 项目将集成我们在 Pleias 开发的 Common Corpus 和一些预训练工具——其余的将是 fineweb,很可能还有 Nous 或 Arcee 的后训练指令集。

当前的资金环境存在一些严重的问题。即使 OpenAI 也意识到了这一点。最近,人们对硅谷初创公司中缺乏“垂直强化学习”感到有些不满[6]。我相信这条信息直接来自 Sam Altman,并且很可能会导致下一个 YC 批次的一些调整,但指向一个更大的转变:很快,大实验室选择的合作伙伴将不再是 API 客户,而是涉及早期训练阶段的关联承包商。

如果模型是产品,你不可能孤军奋战。搜索和代码是容易到手的低垂之果:过去两年的主要用例,市场几乎成熟,你可以在几个月内推出一个新 cursor。现在,许多最有利可图的 AI 用例在未来都还没有发展到这个阶段——通常,想想这些仍然统治着世界经济的大部分规则化系统……小型的跨领域专家团队,具有高度的专注力,可能是最佳定位来应对这些挑战——最终在完成初步工作后,可能成为潜在的收购目标。我们可能看到同样的管道在 UI 方面。一些首选合作伙伴,如果他们能够进行业务收购,将获得独家 API 访问权限,以访问封闭的专用模型。

我还没有提到 DeepSeek,也没有提到中国实验室。仅仅因为 DeepSeek 已经向前迈进了一步:不仅是作为产品,而且作为通用的基础设施层。就像 OpenAI 和 Anthropic 一样,梁文锋公开了他的计划[7]:

我们认为,当前阶段是技术创新的爆炸,而不是应用的爆炸(……)如果形成一个完整的上游和下游工业生态系统,那么我们就没有必要自己开发应用。当然,如果需要,我们当然可以开发应用,但研究和技术创新始终是我们的首要任务。

在这个阶段,只专注于应用就像“用上一场战争的老将打下一场战争”。我担心我们现在正处在这样一个阶段,许多西方人甚至都没有意识到上一场战争已经结束了。


原文到这里就结束了,这是一个比较新的视角:将模型本身看作是核心竞争力,认为AI 的下一阶段发展将不再以应用层为核心,而是转向模型本身成为最终产品和服务的主要驱动力。

这其实是比较“离经叛道”的观点,因为它与整个行业的普遍工程实践相左。我们可以看到,如果模型的成长本身就能够完成这些进阶工作,会导致许多现有的“应用层”功能将被直接取代:

  • 第三方 API 供应商可能很难存活:封闭模型提供商(它们独占自己的模型)可能会逐渐停止销售 API,转而直接提供完整的产品或服务;

  • 专注应用层开发的公司将处于弱势,而这正是当前获得投资和发展的热点领域;

  • 模型生态加速收敛至头部的公司,模型初创公司的生存空间将进一步挤压,资源将进一步集中。

而对于我们消费者来说,好日子也应该不会持续太久,毕竟这门生意虽然看着高级,却并没有这么赚钱。当模型能力和生态进一步集中至大公司手中,你的个人助理看起来也就不再那么个人了。

不管怎么说,且用且珍惜吧。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询