我要投稿

OpenAI GPT-4.5: 无聊又穷凶极恶

发布日期：2025-02-28 17:25:18 浏览次数： 1657 作者：字节笔记本

OpenAI终于放出了传说中的GPT-4.5（内部代号Orion），这可能是AI史上最奇葩的一次重大更新 — 它既无聊又穷凶极恶。

穷

—

OpenAI这次的定价简直是丧心病狂！

每100万输入tokens收费75美元，输出tokens更是高达150美元。

也就是说，GPT-4.5的成本是GPT-4o的30倍，是Claude 3.7 Sonnet的25倍！实际上，它的价格是市场上其他模型的10-100倍！

这哪是定价，这简直是劝退价啊！

OpenAI自己都承认，GPT-4.5的运行成本之高，可能让他们重新考虑是否长期开放API。

没错，这是一个"上线即躺平"的模型。

无聊

—

按理说如此天价的模型，性能应该达到令人窒息的程度吧？

结果GPT-4.5只是为了告诉大家：传统预训练模式已经走到尽头了！

它的预训练计算量是GPT-4的10倍！结果呢？基准测试只比4o好了可怜的5%。在代码测试方面，它超过了Claude 3.5，但又不如Claude 3.7。

总结就三个字：尴尬至极！又贵，又慢，又不够好。

Sam Altman还振振有词地说GPT-4.5带来了"微妙的提升"，虽然在数学、代码等硬核推理领域并不出彩，但在理解人类意图和情感回应方面达到了新高度。

翻译一下：我们花了天价算力，却只做出了一个更会"共情"的AI。

Sam自己都承认"它刷分不行，但是有思想" —— emmmm，这听起来像不像在为幻觉找借口？

内部测试者反馈称GPT-4.5"更温暖、直观、自然"，具备"更强的审美直觉和创造力"。

说人话就是：

我们的模型从T型人格变成F型人格了，搞懂了你的感受却解决不了你的问题?‍♂️

极恶

—

真正的"极恶"之处不是模型本身，而是OpenAI未来的发展路线。

奥特曼宣称GPT-4.5将是"最后一个非思维链模型"，这话听着无害，实际其影响可能极其恶劣。

作为目前事实上的行业老大，OpenAI的战略选择会影响整个AI生态。

思维链模型的确是一个好东西，但是并不是所有的场景全部都适合思维链

思维链有缺点：速度慢、成本高、效率低。现实世界中，企业和普通用户可能需要的是高效实用的API，不是每个问题都需要模型冥思苦想几分钟才能回答。

思维链应该是一种选择，而非唯一路径。

不是所有任务都需要推理链的轮番折腾 — 这就像你问路，对方非要给你讲述从地球板块形成到城市规划的全过程一样荒谬。

这种"全面推理化"的跟风趋势将导致其它厂商的跟风：API成本飙升，中小企业被挤出市场响应时间延长，用户体验下降，简单任务复杂化，资源浪费

更可怕的是，这种路线可能会让AI技术进一步向超大科技公司集中，因为只有他们才能承担起这种计算成本。

真相

—

Ilya Sutskever曾直言："我们已经达到了数据的巅峰，传统的预训练方式即将终结。"GPT-4.5的表现似乎印证了这一点。

我个人的解读是：OpenAI正试图通过人为制造技术瓶颈，为其高成本的新路线铺路。市场需要百花齐放 — 有的场景需要深思熟虑，有的场景需要快速响应。强行将所有需求引向单一技术路线，这不是一个行业领导者应该做的。它代表的发展方向会如何重塑整个AI产业。

效率与智能本应是并行发展的两条路线，而非非此即彼。

最后送Altman一句话：做个好人吧！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

10万元跑满血版DeepSeek，这家公司掀了一体机市场的桌子｜甲子光年

2025-04-29

谷歌大神首次揭秘Gemini预训练秘密：52页PPT干货，推理成本成最重要因素

2025-04-29

一文说清：什么是算法备案、大模型备案、大模型登记 2.0

2025-04-29

MCP：AI时代的“万能插座”，大厂竞逐的焦点

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

一站式AI应用开发平台 Firebase Studio

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

从MCP到超级Agent：这场AI生产力革命将淘汰谁？

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB