我要投稿

我体验完刚发布的Claude3.5，发现最强的是这个新功能。

发布日期：2024-06-21 06:36:31 浏览次数： 4988 作者：数字生命卡兹克

OpenAI的最大对手，Anthropic，没有任何预兆的，官宣了自己的新模型。

Claude 3.5 Sonnet。

Claude3家族原本有三个参数量级的模型，分别是：

Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

可以理解成Opus（大杯）、Sonnet（中杯）、Haiku（小杯）。

而这一次，是把中等参数模型Sonnet的3.5升级版放了出来。

在跑分上，除了MMLU（本科水平的知识）和MATH（数学能力）上，基本都达到了最佳。

此处要注意，Claude 3.5 Sonnet只是一个中等参数模型，在参数量级上远远达不到Claude 3 Opus的级别，但是在跑分上超了，这就很恐怖。

而在多模态的视觉能力上也基本达到了全面领先。

除了视觉问答（MMMU）离GPT4o还查了小1个点之外，其他的4项：视觉数学推理 (MathVista)、科学图表理解 (AI2D)、图表问答、文档视觉问答 (ANLS)，都达到了最佳水平。

最搞的是，Anthropic在发布Claude 3.5 Sonnet前为了预热，搞了一段小插曲，他们发了一段谜语。

我看了半天也没看明白，然后朋友跟我说，视频里面的是摩斯密码，转换过来是Sonnet，上面的密码要用维吉尼亚密码去破，那一刻我才焕然大雾。

于是我扔给了GPT，GPT给我破译了出来，得到了一段诗。

No more be grieved at that with which thou hast done - 不再因你所做的事情而感到悲伤。
Roses have thorns and silver fountains mud - 玫瑰有刺，银色的泉水也有泥。
All models err yet between the third and fourth - 所有的模式都会出错，但在第三和第四之间。
Run our new creation blooms a wiser bud - 我们的新创造将绽放出一个更智慧的花蕾。

说实话破完了又一次给我干懵逼了，这个谜语让我感受到了我智商的低谷。。。

搜了半天，然后发现这段，原来是莎士比亚的第35首十四行诗，而十四行诗，其实对应的单词就是Sonnet。

那这下，答案就呼之欲出了，Anthropic要发Claude 3.5 Sonnet了。

就在我兴致勃勃的准备去炫耀我解出来谜题的时候，发现Anthropic已经发公告正式官宣发布Claude 3.5 Sonnet 10分钟了。。。

全世界都知道了，而且是在我花了好大力气解完谜题之后，尼玛，瞬间有一种被Anthropic背刺的感觉。

话说回来，除了以中等参数实现了综合跑分第一外，Claude 3.5 Sonnet的运行速度是Claude 3 Opus的2倍，但是定价会更便宜，毕竟是中等参数的模型。

推理能力也确实有了提升，但是坦率的讲，对于普通用户来说，可能直观的差异性，不是很大。

最让我惊喜的，其实是他们的新功能，Artifacts。

当用户要求 Claude 生成代码片段、文本文件或网站设计等内容时，右边就会多出来一个实时的窗口，这个就是Artifacts。

这个功能需要手动开启，点击头像，有个Feature Preview，点进去，把Artifacts打开就行。

比如说，我想让Claude帮我做一个横版跳跃的小游戏，坤哥跳过各种障碍物的小游戏。

我在打开Artifacts后，先让claude给我画一个主角，跟它说：

给我画一个8-bit的svg小人，灰色身体，白色头发，旁边有一个篮球。

他就会嘟嘟的写代码，这时候，右边的Artifacts窗口就会被打开。

所有代码全部写完后，他就会出来一个预览和code的tab，此时，你就可以直接在Artifacts窗口里的预览tab看到画出来的svg小人了。

然后，我们在让claude帮忙画一些装饰的鸡。

主角有了，鸡有了，现在，我们让claude帮忙做一个游戏，一个横版的跳跃游戏，我们的主角坤哥需要不断的跳过一只一只的小鸡。

我直接说：现在，请帮我做一个横版的跳跃游戏，可操控的主角是8-bit的小人，需要跳过的障碍物是不断迎面而来的一只一只不同的小鸡，背景是蓝色的天空。我每次按空格键就是跳跃。

很快，代码就写好了。

然后，我们在预览窗口，是真的，可以直接玩这个游戏的。

虽然把篮球给我干消失了，但是无伤大雅。

所以，Artifacts对于很多开发者来说，未来，是有巨大的效率提升的，直接以可视化的方式展现在你的面前，甚至，还是可以交互的。

可以预期到，未来例如网页设计等等，会有巨大的效率提升。

甚至，你可以在Claude里，直接做一个PPT。

就非常的离谱。

相比于模型的更新，这种功能的更新，可能会实打实的更让我兴奋，它真的可以提升效率，以及整出不一样的花活。

而ChatGPT虽然也有类似的交互，但是也只局限于一些数据分析场景。

Claude，这次，是做了大幅度的进化。

最后，Anthropic说，会在今年晚些时候，放出Claude 3.5 Haiku 和 Claude 3.5 Opus。

也在探索ChatGPT目前特有的记忆功能。

反正，这些模型厂商卷起来，对我们普通用户来说，肯定是好事。

只是老黄，可能要抱着他的英伟达，在那个铁王座上，坐的更久一点了。

还有那个奥特曼。

你的GPT-5，到底啥时候端上来？

哦不对，先把你的完全版的GPT4o端上来再说吧。

一个多月了，我还没用上新语音和新视觉呢= =

呸，渣男。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

MCP：AI时代的“万能插座”，大厂竞逐的焦点

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

一站式AI应用开发平台 Firebase Studio

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

AI 落地难？MCP 或许就是那把「关键钥匙」！

2025-04-29

企业级大模型推理和部署平台 2025

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

从MCP到超级Agent：这场AI生产力革命将淘汰谁？

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB