我要投稿

Claude3.7深夜炸场：“编程+推理”双杀

发布日期：2025-02-25 17:49:39 浏览次数： 1900 作者：飞哥数智谈

前言

今天凌晨2点半，Anthropic突然甩出王炸——Claude 3.7 Sonnet携全新Claude Code编程工具横空出世！

这款号称“迄今最智能”的混合推理模型，估计会让目前已经火热的AI程序员赛道更加白热化起来。

发布内容

混合推理：一个模型，两种模式

Claude 3.7 Sonnet首次将普通模式与扩展模式（推理模式）合二为一：

普通模式：流畅对话，适合日常问答、创意写作（比如生成催泪爱情故事，文笔细腻到以假乱真）。
扩展模式：用逆向推理、思维链拆解复杂问题（如经典的海盗分金币博弈），专治数学、编程、逻辑分析等硬核场景。

看过以往分享的朋友应该都知道，Cursor 目前已经是我的主要生产力工具之一。

而使用 Cursor 时 Claude 3.5 Sonnet一直是我的首选，个人感觉生成质量远超 GPT-4o。现在增加了思考模式，不知道会进化到什么程度。

20250225160908

API 灵活控制

Claude 3.7 Sonnet 首次引入思考预算机制，允许开发者通过 API 对模型的思考过程进行细粒度控制：

动态调节思考深度：用户可设定模型思考的 token 上限（最高支持 128K token），在速度、成本与答案质量间灵活权衡。例如，简单任务可限制为 500 token 快速响应，复杂数学题则开放更多 token 进行深度推理。
双模式无缝切换：标准模式（快速响应）与扩展模式（深度思考）共享同一模型架构，无需切换接口即可实现功能调用，开发者仅需调整参数即可适应不同场景需求。
成本透明化：API 定价沿用前代标准（输入 3 美元/百万 token，输出 15 美元/百万 token），且思考 token 消耗计入输出成本，避免隐性费用。

虽然使用 Cursor 后不再关注 API 的消耗细节，但是这部分升级确实还是很地道的。

Claude Code

同步推出的 Claude Code 工具，则是将 AI 协作能力直接嵌入开发者的工作流：

终端级工程代理：支持从代码搜索、文件编辑到测试运行、Git 提交的全流程操作，甚至能通过命令行调用工具链（如 Replit 构建 Web 应用）。
效率革命性提升：早期测试中，该工具单次任务可节省 45 分钟以上手动操作（例如重构代码库或修复复杂 Bug）。
GitHub 深度集成：所有订阅计划用户均可将代码仓库直连 Claude，模型可基于完整项目上下文提供精准建议（如修复版本冲突或生成 API 文档）。

v2_f2da162950444256b7d3a3852fdb2b7e@1743780481_oswg131025oswg1080oswg608_img_000

和 Cursor 比起来，Claude Code 可能更加的 Agent 一些，它没有代码审查、编辑界面，直接通过对话方式，借助思维链“边写边改”来生成最终应用。

这种模式好像更加符合人人都是程序员的未来。

性能跃迁

虽然 Anthropic 宣称重点关注AI的应用实践优化，但是各项打榜指标依旧非常亮眼。

编码能力断层领先：在 SWE-bench 测试中，扩展模式以 70.3% 通过率刷新行业纪录（对比 Claude 3.5 Sonnet 的 62.3%），尤其在处理全栈更新、复杂依赖关系时展现超强稳定性。
数学与科学推理升级：扩展模式下，数学竞赛题（如 AIME）准确率大幅提升，物理问题解决精准度接近人类专家水平。
多模态与游戏测试突破：在《宝可梦红》模拟测试中，模型通过数万次虚拟按键交互击败三位道馆馆主，验证其长期任务处理能力。

f6c55bb30c8c877b06b314d897ef4f9

Cursor集成

Cursor 已经支持Claude 3.7了，分为两种模式。

20250225132046

总结

一般模型更新，笔者也有关注，但不是很多，但是作为编程使用最频繁的Claude更新了，那一定要好好使用下，大家期待下后续分享吧~

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

OpenAI 白送 200 美元的深度研究功能？实测后发现这个「阉割版」不如不用

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

2025-04-25

医疗大模型案例分析（一）：Google Med-PaLM

2025-04-25

vLLM+Qwen-32B+Open Web UI构建本地私有大模型

2025-04-25

AI产品经理思考MCP（3）：MCP的未来可能

2025-04-25

AI产品经理思考MCP协议（2）：标准化的必要性

2025-04-25

AI产品经理思考MCP协议（1）：预见MCP——我的“万能库”与标准化之路

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部