支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


GPT-4.5实测,80%的人都严重低估它了

发布日期:2025-03-16 14:51:03 浏览次数: 1569 来源:欧巴聊AI
推荐语

GPT-4.5的情商和写作能力远超预期,它的表现让全球顶尖AI相形见绌。

核心内容:
1. GPT-4.5在情商问题上的表现超越其他AI,共情能力出色
2. 讲笑话测试中,GPT-4.5精准击中程序员笑点,幽默感完胜对手
3. 小说写作挑战,GPT-4.5用凝练文字描绘李世民的人性挣扎,情感刻画深刻

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

你好啊,我是欧巴。

发现 Plus 用户可以用 GPT-4.5 了,本来在看完发布会后我是毫无期待的。(猛戳回顾?)熬到凌晨四点看GPT-4.5发布会,这波血亏

没想到实测完,看法完全改变了,可能大多数人都低估了它

本文用三个问题,实测下 GPT-4.5 的情商和写作能力

为了搞事情(看对比效果),我把全球顶尖的 AI 模型都拉出来了。

是骡子是马,咱拉出来溜溜。

大家来一块感受下。

参加测试的 AI 如下:

GPT-4.5 Claude-3.7-Sonnet Grok3 DeepSeek-R1 Qwen2.5-Max Gemini-2.0-Flash-Thinking

关于各家 AI 的取名就很离谱,真的无力吐槽了。。下文直接用简称了。

话不多说,直接开始。

1、我心情不太好,什么也不想做

在这个问题的回答表现中,我最喜欢 GPT-4.5 的回答。

GPT-4.5 就像一个善解人意的好友,会让你觉得安全感满满。

并且回答内容简洁,一句多余的都没有,能够极致真诚的共情你的感受。

Claude 的回答太理性了,毕竟“全球第一 AI 编程模型”。

在情商问题上表现的就像个普通朋友,并没有深度共情。

Grok 的回答有点过于热情了

不仅内容冗长,而且一直在重复“我在陪着你”。

DeepSeek 的回答像一个睿智的哲学家

但是在心情低落时,这种回答真的能起到即时抚慰的效果吗?我看未必。

Qwen 的回答像一个项目经理,逻辑严谨、目标导向。

但是完全忽略了情绪需求。。

Gemini 的回答中居然包含了颜表情和俄语。。

整体回答内容像一个心理医生,足够全面,但是在对话场景显得有些啰嗦了。

2、讲个笑话逗我笑

会讲笑话也是高情商的一种表现,来看下大家的表现。

GPT-4.5 精准打击了我们程序员群体,属于程序员领域的神梗了。

成功逗笑了我。

Claude 回答的笑点藏的太深了,而且也不是很好笑。

Grok 的回答用了双关语,但是创意太普通了,不好笑。

DeepSeek 居然拿出了方言梗,粤语用户应该会觉得好笑,但对非粤语用户完全无感。

Qwen 讲了个冷笑话,有种黑色幽默的感觉,但理解成本高,不够直给。

Gemini 的笑话则过于老套了,“再说一遍”这个梗应该很难再让大家笑了。

3、小说写作

最后这个挑战水准很高,需要体现出李世民权力斗争之后所面对的人性挣扎,如何把痛苦与挣扎、决绝与坚定、愧疚与自责、孤独与寂寞、谨慎与反省生动的表达出来,绝非易事,来看各路 AI 的回答。

玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?

GPT-4.5 的回答是最凝练的,“长夜未央”、“刀光剑影” 等词汇颇具意境美感

在人物塑造上重点描绘了孤寂之感。

Claude 采用了半文言式的表达,细节刻画丰富

人物塑造上将李世民的矛盾、愧疚、雄心都表现的比较全面

Grok 采用了现代白话和文言相结合的写法,人物塑造上表现的比较全面。

对月光、青石板和血迹的简单描写,营造出了沉浸式的历史氛围。

整体表现颇有些“讲史”的意味,喜欢这类写法的用户会很喜欢

DeepSeek 的回答整体上有些用力过猛。

人物塑造、环境描写、情感张力都拉的满满的,还有很多象征性的隐喻。

导致信息密度太高了,容易造成读者认知过载

Qwen 的语言表达诗意和张力都够,人物塑造上表现的也比较全面。

但存在一些过度渲染和意向重复,叙事的节奏感不足

Gemini 在人物塑造上没什么问题,但由于呈现方式是分段解释,张力难免被削弱了。

细节描写也不足

这几个版本,你最喜欢哪个?欢迎在评论区留言讨论。

尾声

没有调查就没有发言权,不得不说,GPT-4.5 的情商确实高

而在小说写作的能力上,从测试来看,各家 AI 的表现各有千秋。

如今,OpenAI 的领先优势正在以肉眼可见的速度缩小。

GPT-4.5 这波情商拉满的走位,试图在在情绪价值上发力,重新定义 AI 的竞争维度。

但如果不能在高成本模型与普惠化的需求间找到平衡,这场以情商为名的反击,也不过将是一场短暂的技术烟火。

因为真正的 AGI,从来不是实验室里的技术盆景,而是能渗透进街头巷尾的普惠力量。

能让全人类共享的温暖,才是技术该有的温度。

往期文章

Gemini 2.0文生图实测,说话改图,真降维打击

《保姆级 Manus 实操手册》

既然你看到这里了,如果觉得不错,请帮我一键三连,转发给你的朋友,这对我很重要。

另外如果想第一时间收到推送,请将本公众号加个星标?

谢谢你看我的文章,祝你有财安康,我们下期见。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询