AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI GPT-4.5: 无聊又穷凶极恶

发布日期:2025-02-28 17:25:18 浏览次数: 1536 来源:字节笔记本
推荐语

OpenAI GPT-4.5:天价AI的尴尬与未来

核心内容:
1. GPT-4.5惊人的定价策略及其市场影响
2. GPT-4.5性能提升的尴尬现实与内部测试反馈
3. OpenAI未来路线图的潜在影响及行业老大的重任

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

OpenAI终于放出了传说中的GPT-4.5(内部代号Orion),这可能是AI史上最奇葩的一次重大更新 — 它既无聊又穷凶极恶。

59051824-ac31-47a1-b0ed-26caad2d14c8.png

OpenAI这次的定价简直是丧心病狂!

每100万输入tokens收费75美元,输出tokens更是高达150美元。

也就是说,GPT-4.5的成本是GPT-4o的30倍,是Claude 3.7 Sonnet的25倍!实际上,它的价格是市场上其他模型的10-100倍!

图像

这哪是定价,这简直是劝退价啊

OpenAI自己都承认,GPT-4.5的运行成本之高,可能让他们重新考虑是否长期开放API。

错,这是一个"上线即躺平"的模型。

无聊

按理说如此天价的模型,性能应该达到令人窒息的程度吧?

结果GPT-4.5只是为了告诉大家:传统预训练模式已经走到尽头了!

它的预训练计算量是GPT-4的10倍!结果呢?基准测试只比4o好了可怜的5%。在代码测试方面,它超过了Claude 3.5,但又不如Claude 3.7。

图像

总结就三个字:尴尬至极!又贵,又慢,又不够好。

Sam Altman还振振有词地说GPT-4.5带来了"微妙的提升",虽然在数学、代码等硬核推理领域并不出彩,但在理解人类意图和情感回应方面达到了新高度。

翻译一下:我们花了天价算力,却只做出了一个更会"共情"的AI。

图像

Sam自己都承认"它刷分不行,但是有思想" —— emmmm,这听起来像不像在为幻觉找借口?

内部测试者反馈称GPT-4.5"更温暖、直观、自然",具备"更强的审美直觉和创造力"。

说人话就是:

我们的模型从T型人格变成F型人格了,搞懂了你的感受却解决不了你的问题?‍♂️

极恶

真正的"极恶"之处不是模型本身,而是OpenAI未来的发展路线。

奥特曼宣称GPT-4.5将是"最后一个非思维链模型",这话听着无害,实际其影响可能极其恶劣。

image-20250228082146665

作为目前事实上的行业老大,OpenAI的战略选择会影响整个AI生态。

思维链模型的确是一个好东西,但是并不是所有的场景全部都适合思维链

思维链有缺点:速度慢、成本高、效率低。现实世界中,企业和普通用户可能需要的是高效实用的API,不是每个问题都需要模型冥思苦想几分钟才能回答。

思维链应该是一种选择,而非唯一路径。

不是所有任务都需要推理链的轮番折腾 — 这就像你问路,对方非要给你讲述从地球板块形成到城市规划的全过程一样荒谬。

这种"全面推理化"的跟风趋势将导致其它厂商的跟风:API成本飙升,中小企业被挤出市场响应时间延长,用户体验下降,简单任务复杂化,资源浪费

更可怕的是,这种路线可能会让AI技术进一步向超大科技公司集中,因为只有他们才能承担起这种计算成本。

真相

Ilya Sutskever曾直言:"我们已经达到了数据的巅峰,传统的预训练方式即将终结。"GPT-4.5的表现似乎印证了这一点。

我个人的解读是:OpenAI正试图通过人为制造技术瓶颈,为其高成本的新路线铺路。市场需要百花齐放 — 有的场景需要深思熟虑,有的场景需要快速响应。强行将所有需求引向单一技术路线,这不是一个行业领导者应该做的。它代表的发展方向会如何重塑整个AI产业。

效率与智能本应是并行发展的两条路线,而非非此即彼。

最后送Altman一句话:做个好人吧!


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询