我要投稿

大模型该往何处去？百度李彦宏：行业存在三大认知误区

发布日期：2024-09-12 06:35:01 浏览次数： 1814 作者：子弹财经

“外界对大模型有相当多的误解。”近日，李彦宏一则内部讲话曝光再次将大众的关注点转向了大模型及AI领域。

据称，在最近一次和员工交流中，李彦宏首次谈到了当下行业对大模型存在的三个认知误区——大模型竞争、开源模型效率、智能体趋势。

在他看来，大模型的天花板很高，现在距离理想情况还相差非常远，所以模型要不断快速迭代、更新和升级。这个过程可能需要几年、十几年如一日地投入，才能真正满足用户需求，帮助用户降本增效。

关于大模型竞争

榜单不代表真正实力

自去年3月以来，大模型相关领域发展得非常迅猛。很多玩家为了证明自身的产品好，会在发布之后打榜、猜测试题目、答题技巧等。在外界看来，榜单上的数据似乎表明各个大模型的能力，已经没有壁垒。

但李彦宏并不认同这一观点。他表示，每一个新模型发布时，都想说自己有多好，每次都去跟先进的模型做比较，拿测试集或者弄一些榜单，说自己的得分已经跟它差不多了，甚至某些单项上得分已经超过GPT-4，但这并不能证明这些新发的模型与OpenAl这类先进的模型没有那么大的差距了。

因为，模型之间的差距是多维度的，而不是简单地“跑分”。

一是能力。不管是理解能力、生成能力、逻辑推理能力还是记忆能力等这些基本能力上的差距；

二是成本，大模型想具备某种能力或想精准回答一些问题，需要付出多少成本？有些模型可能推理速度很慢，虽然也达到同样的效果，但实际上它的体验还是不如最先进的模型。

在百度文心大模型的实际使用过程中，百度不允许技术人员去打榜。因为真正衡量文心大模型能力的是，在具体应用场景当中到底有没有满足用户的需求。

图 / 摄图网，基于VRF协议

有没有帮助用户产生价值的增益，这是百度真正在乎的。

关于开源模型效率

在商业领域不占优势

在此次内部讲话中，李彦宏进一步阐释了外界对开源大模型认知的第二个误区，即开源模型，并不能解决根本的算力问题。而算力往往需要支持高昂的成本。

“在大模型时代之前，大家习惯了开源意味着免费、意味着成本低。” 他解释说，比如开源的Linux，因为已经有了电脑，所以使用Linux是免费的。但这在大模型时代并不成立。

大模型推理是很贵的，开源模型也不会送算力，还得自己买设备，无法实现算力的高效利用。

“效率上开源模型是不行的。” 他表示：“ 闭源模型准确讲应该叫商业模型，是无数用户分摊研发成本、分摊推理用的机器资源和GPU，GPU的使用效率是最高的，百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”

图 / 摄图网，基于VRF协议

李彦宏分析，在教学科研等领域，开源模型是有价值的；但在商业领域，当追求的是效率、效果和最低成本时，开源模型是没有优势的。

关于智能体趋势

是重要发展方向，

但还不是业界共识

当前，智能体已经受到越来越多的大模型公司及客户的关注。但关于未来的发展，各家的认知并未达成一致。

在内部讲话中，李彦宏谈到了大模型应用的发展阶段，他认为首先出现的是Copilot，对人进行辅助；接下来是Agent智能体，有一定的自主性，能自主使用工具、反思、自我进化；这种自动化程度再发展，就会变成AI Worker，能独立完成各方面的工作。

“虽然有很多人看好智能体这个发展方向，但是到今天为止，智能体还不是共识，像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。”李彦宏表示。

为什么要强调智能体？

李彦宏也给出了答案，“智能体的门槛确实很低”。

很多人不知道怎么把大模型变成应用，而智能体是一个非常直接、高效、简单的方式，在模型之上构建智能体相当方便。

据他透露，目前，每周都有上万个新的智能体在百度文心智能体平台上被创造出来，智能体在百度生态的日均分发次数已快速增长至800万次。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

OpenAI 白送 200 美元的深度研究功能？实测后发现这个「阉割版」不如不用

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

2025-04-25

医疗大模型案例分析（一）：Google Med-PaLM

2025-04-25

vLLM+Qwen-32B+Open Web UI构建本地私有大模型

2025-04-25

AI产品经理思考MCP（3）：MCP的未来可能

2025-04-25

AI产品经理思考MCP协议（2）：标准化的必要性

2025-04-25

AI产品经理思考MCP协议（1）：预见MCP——我的“万能库”与标准化之路

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB