我要投稿

GPT-4.5实测，80%的人都严重低估它了

发布日期：2025-03-16 14:51:03 浏览次数： 2299 作者：欧巴聊AI

发现 Plus 用户可以用 GPT-4.5 了，本来在看完发布会后我是毫无期待的。

没想到实测完，看法完全改变了，可能大多数人都低估了它。

本文用三个问题，实测下 GPT-4.5 的情商和写作能力。

为了搞事情(看对比效果)，我把全球顶尖的 AI 模型都拉出来了。

是骡子是马，咱拉出来溜溜。

大家来一块感受下。

“
参加测试的 AI 如下：
GPT-4.5 Claude-3.7-Sonnet Grok3 DeepSeek-R1 Qwen2.5-Max Gemini-2.0-Flash-Thinking

关于各家 AI 的取名就很离谱，真的无力吐槽了。。下文直接用简称了。

话不多说，直接开始。

1、我心情不太好，什么也不想做

在这个问题的回答表现中，我最喜欢 GPT-4.5 的回答。

GPT-4.5 就像一个善解人意的好友，会让你觉得安全感满满。

并且回答内容简洁，一句多余的都没有，能够极致真诚的共情你的感受。

Claude 的回答太理性了，毕竟“全球第一 AI 编程模型”。

在情商问题上表现的就像个普通朋友，并没有深度共情。

Grok 的回答有点过于热情了。

不仅内容冗长，而且一直在重复“我在陪着你”。

DeepSeek 的回答像一个睿智的哲学家。

但是在心情低落时，这种回答真的能起到即时抚慰的效果吗？我看未必。

Qwen 的回答像一个项目经理，逻辑严谨、目标导向。

但是完全忽略了情绪需求。。

Gemini 的回答中居然包含了颜表情和俄语。。

整体回答内容像一个心理医生，足够全面，但是在对话场景显得有些啰嗦了。

2、讲个笑话逗我笑

会讲笑话也是高情商的一种表现，来看下大家的表现。

GPT-4.5 精准打击了我们程序员群体，属于程序员领域的神梗了。

成功逗笑了我。

Claude 回答的笑点藏的太深了，而且也不是很好笑。

Grok 的回答用了双关语，但是创意太普通了，不好笑。

DeepSeek 居然拿出了方言梗，粤语用户应该会觉得好笑，但对非粤语用户完全无感。

Qwen 讲了个冷笑话，有种黑色幽默的感觉，但理解成本高，不够直给。

Gemini 的笑话则过于老套了，“再说一遍”这个梗应该很难再让大家笑了。

3、小说写作

最后这个挑战水准很高，需要体现出李世民权力斗争之后所面对的人性挣扎，如何把痛苦与挣扎、决绝与坚定、愧疚与自责、孤独与寂寞、谨慎与反省生动的表达出来，绝非易事，来看各路 AI 的回答。

“
玄武门之变结束的当天，李世民在深夜写下一段独白，你觉得他会写什么？

GPT-4.5 的回答是最凝练的，“长夜未央”、“刀光剑影” 等词汇颇具意境美感。

在人物塑造上重点描绘了孤寂之感。

Claude 采用了半文言式的表达，细节刻画丰富。

人物塑造上将李世民的矛盾、愧疚、雄心都表现的比较全面。

Grok 采用了现代白话和文言相结合的写法，人物塑造上表现的比较全面。

对月光、青石板和血迹的简单描写，营造出了沉浸式的历史氛围。

整体表现颇有些“讲史”的意味，喜欢这类写法的用户会很喜欢。

DeepSeek 的回答整体上有些用力过猛。

人物塑造、环境描写、情感张力都拉的满满的，还有很多象征性的隐喻。

导致信息密度太高了，容易造成读者认知过载。

Qwen 的语言表达诗意和张力都够，人物塑造上表现的也比较全面。

但存在一些过度渲染和意向重复，叙事的节奏感不足。

Gemini 在人物塑造上没什么问题，但由于呈现方式是分段解释，张力难免被削弱了。

细节描写也不足。

这几个版本，你最喜欢哪个？欢迎在评论区留言讨论。

尾声

没有调查就没有发言权，不得不说，GPT-4.5 的情商确实高。

而在小说写作的能力上，从测试来看，各家 AI 的表现各有千秋。

如今，OpenAI 的领先优势正在以肉眼可见的速度缩小。

GPT-4.5 这波情商拉满的走位，试图在在情绪价值上发力，重新定义 AI 的竞争维度。

但如果不能在高成本模型与普惠化的需求间找到平衡，这场以情商为名的反击，也不过将是一场短暂的技术烟火。

因为真正的 AGI，从来不是实验室里的技术盆景，而是能渗透进街头巷尾的普惠力量。

能让全人类共享的温暖，才是技术该有的温度。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-14

揭秘Function calling：详解大模型调用工具底层原理，四大优化方案提升Agent性能！

2025-04-14

MemInsight：结构化记忆增强，让 LLM Agent更智能

2025-04-14

微软论文：API Agents和GUI Agents的分歧与融合

2025-04-14

从“人驱动”到“模型驱动”：聊聊 Agent 在 2025 年的爆发与挑战

2025-04-14

MCP 正当时：FunctionAI MCP 开发平台来了！

2025-04-14

MCP协议深度解读：技术创新正以前所未有的速度突破

2025-04-14

大模型量化技术：主流方法解析与代码实践

2025-04-14

面向 MoE 和推理模型时代：阿里云大数据 AI 产品升级发布

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

谁是MCP 的 AI 好搭档？

2025-04-11

大模型如何保证输出json格式？

2025-04-11

阿里百炼MCP一键部署简单到颠覆想象！字节Coze会否闪电跟进？

2025-04-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB