我要投稿

DeepSeek发布最新版V3，代码和审美有了质的提升，附5大维度测评

发布日期：2025-03-25 04:35:57 浏览次数： 1910 作者：GeekSavvy

就在3月24日晚，也就是刚刚，没有预兆，DeepSeek 悄悄在 Hugging Face 平台上面更新了它的 V3 模型，DeepSeek-V3-0324。

看了许多 X 网友的帖子发现，DeepSeek-V3-0324 模型（以下统称最新版V3）在前端代码的生成能力上有了质的提升，审美方面也提升了不少，甚至有网友说可以媲美 Claude 3.7 Sonnet。

网友表示最新版 V3 的编码能力已经接近目前地表最强扛把子 Claude 3.7 了。

DeepSeek 也在官方微信群通知，V3 模型已经完成小版本的升级，该版本的最新模型也已经同步至官网、App 和小程序，关闭“深度思考”就可体验。

最新版 V3 主要更新：

1. 上下文窗口达到 128k（之前64k）；

2. 代码能力有了质的提升，审美也跟上了；

3. 还是老规矩，免费、开源、可商用。

01 模型规模与架构

DeepSeek-V3 模型参数 685B，每个 token 激活 37 亿参数，继续沿用 “混合专家系统”（MoE）架构，由 256 个 “专家模型” 组成，根据问题选择 8 位专家协作，采用多头潜在注意力（MLA）降低推理时 KV 缓存，提升推理效率；引入无辅助损失的负载平衡策略，动态调整专家负载；使用多 token 预测（MTP）目标，增加训练信号密度，提高数据效率。

同时，最新版 V3 上下文窗从 64k 提升到128k，支持超长文本理解和生成。不过，有细心的群友发现论文已经的 128k 了，但是官方 API 文档中还是 64k，可能是做了限制，又或是还没更新。

从最新版 V3 与其同类产品的基准性能中，V3 在数学、代码、逻辑推理、知识问答等方面表现优秀，相比 V2 版本有显著提升。

02 实测案例

02.1 代码能力及审美

输入：

用 Vue 3 或 React 编写一个动态天气卡片组件，要求：

1. 响应式布局，适配移动端和桌面端

2. 包含天气图标（如晴/雨/云）、温度、城市搜索输入框

3. 背景色根据天气类型动态变化（如晴天为渐变橙，雨天为渐变蓝）

4. 悬停时有微交互动画（如卡片浮动）
附：使用 Tailwind CSS 或 CSS-in-JS 实现样式。

以上的效果，一遍就过，输入城市名字，就能给出响应的天气卡片，同时背景颜色也会根据天气情况适应变化（当然天气我没配API，都是随机的），响应式布局也ok，网页移动端均适配，审美确实也不错，跟上了。

02.2 数学推理能力

输入：若一个长方体的长、宽、高分别增加 10%、20%、15%，体积增加了多少百分比？

测试模型能否正确分步计算，并给出逻辑清晰的解释。

从模型给出的答案来看，这个数学题的解题思路还是非常清晰的，输出速度也非常快，也没有过多的废话。

02.3 多轮对话与知识问答

输入：量子计算的主要优势是什么？

模型回答后，继续追问：它与传统计算机在 Shor 算法上的具体区别是什么？

继续追问：用表格总结一下量子计算和传统计算的主要区别

连续追问细节，测试上下文保持能力。

刚好前段时间看到朋友关于量子计算的文章，就问了一个关于量子计算的问题，从有限的知识，整体来看，连续追问 3 次之后，上下文的关联能力和一致性还是很不错的，懂量子计算的朋友们也帮我检查一下回答的质量怎么样，欢迎评论区留言。

02.4 高难度翻译

输入：

将以下包含文化隐喻的句子翻译成英语，并解释如何处理隐喻部分：“这个算法像‘老黄牛’一样稳定，但缺乏‘灵鹤’的灵活性。”

用豆包、百度翻译进行验证。

翻译效果不错，翻译成英文的句子再让豆包、百度翻译都能进行中文意思的还原，处理隐喻部分也解释到位。

02.5 长文本理解与摘要

输入：请用500字概括这篇论文的主要贡献和方法

我用 DeepSeek-V3-0324 的论文进行了长文本的测试，论文字数应该是有几万字的，并且是全英，总结的效果和追问都很准确，该模型就是在 2048 个 NVIDIA H800 GPU 的集群上训练出来的。

Last but not least

从以上 5 个方面，包括代码能力、数学推理能力、上下文关联、翻译以及长文本理解来看，V3 确实有了质的提升，尤其是代码能力，生成速度快，审美能力也大幅度提升，相比以往大多数模型的审美，确实像网友所说，可以跟 Claude 3.7 Sonnet 媲美了。

最后，还有就是刚刚开源的最新版 V3 同样可商用，该模型权重已开源在 HuggingFace，可用于研究和商业用途。

AI Coding，它在东方升起来了。

DeepSeek nb！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-16

A2A协议：打破Agent“孤岛”，开启智能协作新时代

2025-04-16

GitMCP: 让AI助手拥抱开源世界的桥梁

2025-04-16

解放双手！Index：顶尖开源AI浏览器代理，复杂网页任务一键搞定 (Claude 3.7 驱动)

2025-04-16

CortexON：开源通用AI Agent，又一替代Manus产品

2025-04-16

AI涌现人类情感！希腊「乐之神」Orpheus开源，单卡可跑语音流式推理

2025-04-16

Second Me 重磅升级：全平台 Docker 支持，Mac/Windows/Linux 全覆盖！

2025-04-15

Spring AI 1.0.0 M7 发布！很炸裂！！

2025-04-15

OpenManus初体验，整合千问大模型Qwen/QwQ-32B

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

为什么大模型本地部署后“没了下文”？

2025-04-03

阿里搞了个大新闻！这AI能听会看还会实时唠嗑，科幻片都不敢这么拍？

2025-04-03

Agent框架大比拼：谁将引领智能应用的未来？

2025-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB