我要投稿

卷王又来了！Claude 3.5 Sonnet 在 Amazon Bedrock 正式上线！

发布日期：2024-06-21 04:20:07 浏览次数： 2310 作者：亚马逊云科技

今天，亚马逊云科技宣布 Claude 3.5 Sonnet 正式在 Amazon Bedrock 可用！这是由我们的合作伙伴 Anthropic 推出的一款业界领先的生成式 AI 基础模型。Claude 3.5 Sonnet 提高了行业的智能水准，它的性能在各种评估中表现优异，不仅超过了上一代，还超过了 Claude 3 Opus！同时，Claude 3.5 Sonnet 具备了 Claude 3 Sonnet 的速度与成本优势，在许多重要的推理、数学、多模态和编程基准测试中表现出色，使其成为复杂分析、多步骤工作流程、视觉和分析用例的优秀选项。

现在海外用户就可以在 Amazon Bedrock 上使用 Claude 3.5 Sonnet，并以五分之一的价格获得比 Claude 3 Opus 更好的生成式 AI 体验。

以两倍的速度实现先进的智能水平

Claude 3.5 Sonnet 具备先进的智能水平，运行速度可达到 Claude 3 Opus 的两倍，在具有研究生水平的推理能力（GPQA）、本科水平知识（MMLU）和编程能力（HumanEval）方面设立了新的行业基准；在理解细微差别、幽默和复杂指令方面表现有显著的提升；在撰写高质量内容时能表现出更自然、更易理解的语气，生成引人入胜和有说服力的内容，简化写作工作流程，提升叙事能力。

Claude 3.5 Sonnet 非常适合处理复杂任务，加上性能的提升与出色的成本效益，使其成为应对包括敏感语境的客户支持和协调多步骤工作流程编排的理想选择。

在内部代理编码评估中，Claude 3.5 Sonnet 解决了64%的问题，超过了解决38%问题的 Claude 3 Opus。我们通过评估测试了该模型在给定自然语言描述过程中的改进，包括修复漏洞或添加功能到开源代码库的能力。当给予提示并提供相关工具时，Claude 3.5 Sonnet 可以独立编写、编辑和执行代码，并具备出色的复杂推理和故障排除能力。它能够轻松处理代码翻译，在更新已有的应用程序和迁移代码库方面表现优异。

极其先进的“视觉”能力

Claude 3.5 Sonnet 模型“具备”极其强大的“视觉”能力，在标准视觉基准测试中超过了Claude 3 Opus。这些显著的进步在处理视觉推理的任务中极为明显，如解释图表、图片及其他需求。Claude 3.5 Sonnet 可以准确地从不完美的图像中转录文本，这对于零售、物流和金融服务等领域客户尤为重要。在这些领域，生成式 AI 从图像、图形或插图中能获得比单纯文本中更多的洞察。

Claude 3.5 Sonnet 还可以用于自动化视觉数据处理任务，提取有价值的信息，增强医疗保健、金融服务、媒体和娱乐工作负载中的数据分析。

对安全性和隐私的承诺

Claude 模型经过了严格的测试和训练，以减少滥用。虽然 Claude 3.5 Sonnet 在智能方面实现了质的飞跃，但 Anthropic 的红队(red team，安全团队，最大化模拟真实世界的攻击)评估得出结论，Claude 3.5 Sonnet 仍处于 ASL-2 （AI Safety Levels）级别。

履行对安全性和透明度的承诺，Anthropic 与外部专家合作，不断测试并完善这一最新模型的安全机制，并于最近向英国人工智能安全研究所提供了 Claude 3.5 Sonnet 部署前的安全评估。英国人工智能安全研究所完成对 Claude 3.5 Sonnet 的测试后，与美国人工智能安全研究所共享了测试结果。

当考虑到滥用的问题时，Anthropic 还整合了外部专家的政策反馈，以确保评估的可靠性。外部资源的参与帮助团队提升了评估 Claude 3.5 Sonnet 时对各种滥用类型的判断能力。