我要投稿

Claude 3.5 Sonnet : 重大更新

发布日期：2024-06-25 08:50:37 浏览次数： 4687

作者：零壹白洞

微信搜一搜，关注“零壹白洞”

Anthropic 最近公布了其最新突破：Claude 3.5 Sonnet。这一新智能模型备受关注，并有可能重新定义生成式人工智能和大型语言模型 (LLM) 的功能。并且Claude 3.5 Sonnet 的特别之处在于 Artifacts 功能。该功能以其即时并行部署各种应用（从 Web 应用到 React 应用）震惊了世界。果然只能用魔法打败魔法

。

Claude 3.5 Sonnet 树立新标杆

Claude 3.5 Sonnet 在一系列评估中均优于其前代产品和竞争对手。在一系列全面的基准测试中，Claude 3.5 Sonnet 表现出了比 OpenAI 的 GPT-4o 和 Google 的 Gemini 1.5 Pro 等知名模型更出色的性能。该模型在需要高级推理和知识应用的领域表现出色。它在研究生水平推理 (GPQA) 和本科生水平知识 (MMLU) 方面树立了新的行业标准，展示了其处理复杂智力任务的能力。这一进步并非渐进式的；Claude 3.5 Sonnet 远远超过了其前身 Claude 3 Opus 的能力。一更新，小编去试了下，速度快，胡乱造的能力还在。

速度是前一代的两倍

该型号的处理速度是 Claude 3 Opus 的两倍。这一显著的性能提升对各个行业的用户具有深远的影响。速度的提升对于处理复杂任务和多步骤工作流程更加高效。比如Claude 3.5 Sonnet 的高级推理能力相结合，为实时 AI 应用开辟了新的可能性。金融和医疗保健等依赖快速决策的行业将从这一改进中受益匪浅。

具有复杂推理能力的编码能力

Claude 3.5 Sonnet 最令人印象深刻的功能之一是其先进的编码能力。在内部代理编码评估中，该模型解决了 64% 的问题，比 Claude 3 Opus 的 38% 有了显著的改进。这一性能飞跃使 Claude 3.5 Sonnet 成为软件开发和代码维护的强大工具。该模型的复杂推理能力使其不仅能够编写代码，还能高度自主地编辑和执行代码。在获得相关工具和说明后，Claude 3.5 Sonnet 可以独立处理复杂的编码任务，展现出理解项目需求、实施解决方案和解决问题的能力。

Claude 3.5 Sonnet 的一个突出特点是其代码转换能力。对于希望更新旧系统或将代码库迁移到新语言或框架的组织来说，此功能尤其有价值。该模型能够理解和转换不同的编程语言，可以大大减少此类转换所需的时间和资源。

这个对可以好用，抄代码搞移植。

视觉能力达到新高度

Claude 3.5 Sonnet 标志着 AI 视觉能力的重大进步，在标准视觉基准上超越了其前身 Claude 3 Opus。这种改进在需要复杂视觉推理的任务中尤为明显，例如解释图表、图形和复杂图表

。该模型的一大突出特点是能够准确地从不完美的图像中转录文本。这种能力对零售、物流和金融服务等行业具有深远的影响，因为从视觉数据中提取信息至关重要。例如，即使图像质量不佳，Claude 3.5 Sonnet 也可以高精度地分析收据、运输标签或财务报表。感觉要一把收割所有的 ML 小模型，强得可怕

。

Artifacts：与 Claude 互动的新方式

Anthropic 推出了一项名为 Artifacts 的新功能，该功能改善了用户与 Claude 3.5 Sonnet 的互动方式。该工具将 Claude 从对话式人工智能转变为协作式工作环境，从而提高了生产力和创造力。

敲黑板了，又来个打破传统交互模式，以往都是对话，现在跟gpt-4o有得一拼。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时，这些工件会与对话一起出现在专用窗口中。这创建了一个动态工作区，用户可以实时查看、编辑和基于 Claude 的作品进行创作，将 AI 生成的内容无缝集成到他们的项目和工作流程中。

Artifacts 功能标志着 Anthropic 朝着将 Claude 打造为团队协作中心的愿景迈出了重要一步。在不久的将来，整个组织将能够将他们的知识、文档和正在进行的工作集中在一个共享空间中，而 Claude 将充当随时可用的代理器。

通过这种方式，开发人员可以在动态工作区中实时查看、编辑和构建 Claude ，轻松地将 AI 生成的内容纳入他们的项目和工作流程中。

Artifacts 体验 case

冥想游戏

以下视频，其中一位人工智能爱好者要求 Claude 创建一个冥想游戏，促使人们呼吸并改变背景颜色。

创建像素画

看一下这个用例，其中 Claude 3.5 Sonnet 模型使用 SVG 以 8 位风格样式进行创作。用例表明 Claude 3.5 Sonnet 具有很强的艺术和思维功能，如果你让它生成有趣的图表，它可以为你提供很好的创新想法。

讲解 GPT Transformer 架构动画

Claude 3.5 Sonnet 可以通过 Artifacts 功能借助交互式图表生成和动画化几乎任何事物。这可以帮助您提高学习水平，并在学习新主题或算法时改善整个交互过程。可以看到 Artifacts 功能模仿了 GPT Transformer 架构的动画。动画的工作方式和符号的运作方式非常有启发性，并提供了对 GPT Transformer 架构的深刻见解。

将文档转换为PPT

以下视频中，可以看到演示文稿在 Artifacts 部分中的显示方式，其中包含要点、描述性段落、摘要、公式等。整体演示文稿设计使其看起来更具吸引力和吸引力。为了让左侧聊天界面更加美观，Claude 3.5 Sonnet 甚至对幻灯片内容进行了逐一解释。

致力于安全和隐私

随着人工智能模型变得越来越强大，人们对安全和隐私的担忧也与日俱增。Anthropic 已经通过 Claude 3.5 Sonnet 正面解决了这些问题。该模型经过了严格的测试，并经过了训练以减少误用。尽管其智能有了显著的飞跃，但评估得出的结论是，Claude 3.5 Sonnet 保持了 ASL-2 评级，表明其安全性很高有待提升。Anthropic 更进一步，聘请外部专家来测试和改进 Claude 3.5 Sonnet 中的安全机制。该模型已提供给英国人工智能安全研究所(UK AISI) 进行部署前安全评估，并与美国人工智能安全研究所(US AISI) 共享结果，作为确保人工智能安全的合作努力的一部分。隐私是 Claude 3.5 Sonnet 开发的另一个基石。Anthropic 一直致力于不使用用户提交的数据来训练其生成模型，除非获得明确许可。在数据隐私受到越来越严格审查的时代，这一立场使 Claude 脱颖而出。

不断发展的人工智能家族的一部分

Claude 3.5 Sonnet 并非独立型号，而是 AI 发展更广阔愿景的一部分。它代表了 Anthropic 型号系列中的中端产品，其中 Haiku 是最小型号，而 Opus 是最高端的型号。这种系列化方法让用户可以根据自己的特定需求和资源选择最合适的型号。

展望未来，Anthropic 计划在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.5 Opus，从而完善 Claude 3.5 模型系列。这种迭代模型开发方法表明了 Anthropic 致力于不断改善智能、速度和成本之间的平衡。抄谷歌套路，然后把谷歌股价打崩。

方便且经济高效

尽管 Claude 3.5 Sonnet 功能先进，但其仍可供广大用户使用。该模型可在 Claude.ai 和 Claude iOS 应用上免费使用，Claude Pro 和 Team 计划订阅者可享受更高的速率限制。对于开发人员和企业，可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。Claude 3.5 Sonnet 的定价结构旨在实现成本效益，尤其是考虑到其增强的功能。该模型每百万输入 token 收费 3 美元，每百万输出 token 收费 15 美元，并具有 200K 令牌上下文窗口。这种定价模型使个人用户和企业都可以充分利用 Claude 的高级功能，而无需花费太多钱。

还是免费吧，不然小编不知道怎么吹了。

设计时充分考虑企业需求

Claude 3.5 Sonnet 不仅仅是一个通用人工智能，它是根据企业需求精心打造的。Anthropic 对商业应用的关注体现在该模型的设计和功能上。该智能模型擅长处理企业环境中常见的复杂、多步骤工作流程，从数据分析到项目管理。与现有业务应用程序的集成是 Anthropic 的首要任务。这意味着 Claude 3.5 Sonnet 可以无缝集成到现有企业系统中，在不破坏既定工作流程的情况下提高生产力。该模型能够理解上下文和细微差别，因此对于上下文敏感的客户支持、详细的市场分析和复杂的数据解释等任务特别有效。

此外，Anthropic 的愿景不仅限于个人任务。该公司旨在将 Claude 定位为组织知识管理的中心枢纽。在不久的将来，企业将能够使用 Claude 3.5 Sonnet 为其文档、正在进行的工作和集体知识创建一个安全、集中的空间。这种方法有望彻底改变大型组织内团队协作和访问信息的方式。

这样的话，办公领域都得颠覆。

根据用户反馈进行调整

Claude 3.5 Sonnet 开发中最重要的方面之一是 Anthropic 对用户驱动改进的承诺。该公司高度重视用户反馈，将其视为改进和增强模型功能的重要组成部分。用户可以直接在产品界面内提交有关 Claude 3.5 Sonnet 的反馈。这种反馈机制具有双重目的：它为 Anthropic 的开发路线图提供信息，并帮助他们的团队改善用户体验。通过积极鼓励和采纳用户意见，Anthropic 确保 Claude 以对用户最有利和最相关的方式发展。

总结

Claude 3.5 Sonnet 代表了 LLM 领域的重大飞跃。凭借其前所未有的智能、增强的速度和跨各个领域的先进能力，它为人工智能所能实现的目标树立了新标准。从其复杂的推理和编码能力到对安全和用户驱动开发的承诺，Claude 3.5 Sonnet 展示了 Anthropic 对人工智能的愿景，即不仅功能强大，而且负责任且适应性强。随着不断发展，Claude 3.5 Sonnet 将重塑企业和个人与人工智能的互动方式，为创新和生产力开辟新的可能性。