微信扫码
添加专属顾问
我要投稿
前沿AI模型Qwen3性能实测,揭示代码生成能力与局限。核心内容: 1. Qwen3前端代码生成测试:简单与复杂提示的表现差异 2. 可视化文档生成能力分析:模型性能与实际应用的对比 3. 小项目代码能力测试:图片圆角处理程序的实际应用结果
刚刚抽空对今天发布的Qwen3 -235B进行了一个简单测试
我主要针对前端代码能力(简单提示,复杂提示),以及稍微具有复杂逻辑的普通人可以玩的小项目代码能力测试
就我目前的的测试来看,qwen3的前端复杂提示表现不太好,复杂项目的代码细节处理稍微欠缺
以下是测试结果:
比如以下三个简单提示,抽卡表现挺稳定的,基本上能生成精美的卡片
1.在strawberry中有多少个“r”?制作一张可爱的卡片
2.9.7和9.22那个大?制作一张可爱的卡片
3.Money is a database for exchange of goods & services. Money doesn't have power in & of itself. The actual economy is goods & services"
一 Elon Musk
制作一张可爱的卡片
提示1:
创建RAG的图形化工作流概述html
测试结果:
一次成功,这个网页并不复杂,有点像流程图,表现还好
上点强度,根据文档内容来创建html可视化文档(上传一个pdf文档,文档是关于今天qwen3发布博客官方blog)
提示2(from mengshao):
帮我将这个内容生成一个HTML网页,具体要求是:
使用 Bento Grid 风格的视觉设计,深色风格,强调标题和视觉突出,注意布局合理性和可视化图表、配图的合理性
测试结果:
可以渲染成功,这个提示词基本上把今天的发布blog进行了一个简单的可视化,遗憾的是模型性能比较部分出现了显示错乱,另外整个可视化太过于简略,开了思考模式,预算拉到最大,最终效果和不开思考模式表现相差不大
由于上面的简单提示对文档进行可视化变现不佳,我又尝试了一下复杂提示
任务还是对qwen3发布blog pdf文档进行可视化
提示词(from藏师傅):
测试结果:
很遗憾,我试了几次网页都没有渲染成功,开启思考模式还是不能渲染成功,所有就这个提示而言,qwen3的复杂提示遵循可能表现不是很好,相应的谷歌Gemini 2.5pro基本每次抽卡都可以成功渲染,而且变现惊艳
我让qwen3实现一个图片圆角处理的小程序,可以在colab里运行
具体提示:
帮我实现一个可以在google colab运行的图片圆角处理程序,要求可以处理任意主流图片格式,包括gif,可以一次上传要处理图片,处理完后,自动下载到桌面,我用的的mac电脑
测试结果:
开启qwen 3的思考模式,代码很快就写好了
把代码复制到colab里,点击运行,上传一张png图片和一张gif格式的图片,成功处理,圆角半径RADIUS = 50
但是打开经过处理的gif图片,发现gif显示有问题,png处理是完美的,这说明qwen3在一些逻辑稍微复杂工程中的会忽略一些细节,以下是处理前后对比(Gemini 2.5 pro对图片圆角处理的代码一次成功,处理效果也很完美)
以上就是qwen3-235B 的一个简单的测试,大家也可以带入自己工作学习的场景试试看
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-29
MCP、RAG、Function Calling、Agent与微调如何重塑未来应用
2025-04-28
Al代码审查实践:从构想到快速落地
2025-04-28
Trae 新版本增加 MCP、Agent、Rules 等多项功能,立即体验
2025-04-28
通用LLM插件系统——简化工具集成,提升2025年AI的灵活性
2025-04-27
演讲实录:中小企业如何快速构建AI应用?
2025-04-27
Cherry Studio v1.2.9:新增多个MCP特性
2025-04-27
为什么新手比专家更想做垂直领域SFT微调?
2025-04-27
使用MCP进行AI集成的6大理由
2025-02-04
2025-02-04
2024-09-18
2024-07-11
2024-07-09
2024-07-11
2024-07-26
2025-02-05
2025-01-27
2025-02-01
2025-04-27
2025-04-27
2025-04-23
2025-04-20
2025-04-01
2025-03-31
2025-03-20
2025-03-16