微信扫码
添加专属顾问
我要投稿
AI大会上的显卡创新,揭示了AI硬件的新动向和市场趋势。核心内容:1. AI一体机硬件特性及成本考量2. “魔改”显卡在AI项目中的部署和市场接受度3. 大显存GPU的未来展望和市场影响
昨天去某AI大会做听众,充点电学习下:)
10-12卡AI一体机
单纯硬件,特别是有些同质化的硬件并不是这类会议的重点。因此传统服务器厂商没怎么来参展,在展台摆出几台AI一体机的好像就这么一家。
这款9U服务器最多能装12块GPU,上图中的4090显卡由于宽度超过标准2-Slot,所以一共是10块。
与大厂那些AI服务器不同的是,这款一体机可能是为了降低成本吧?CPU所在的主板看着缩小了许多。CPU Socket插座我没看错的话,应该是AMD EPYC家族的SP6吧。内存通道6个,单路CPU的PCIe插槽利用率倒是比较高(7个槽中按道理可以支持5个x16)。
做GPU生意:服务成了一个重点
上面这句话,您能听懂多少就算多少,有些不适合放到桌面上说的东西,我也不想写太多。正规渠道货、大家都能做的生意,早就拼成了红海。不过下面这款RTX 4090 48GB既然都印到彩页上了,也就没啥可藏着掖着的。
我记得以往在公众场合,发言人一旦谈到此类“显存扩容”GPU卡时,还会特别提一句“不见得有保障,正规单位谨慎使用”等。但本次会议的专家大佬们,似乎都更加“现实”了,或者说在人们短期的测试中,至少4090 48GB还没出啥大问题吧。
无独有偶,在另一位发言人的ppt讲稿中,直接出现了“2080Ti 22G”,这还是一家挺有名的公司(登台的几乎没有山寨小厂)。可见“魔改”显卡已经不再只是少数人的玩具,而是真的已经部署在了一些项目中。
究其原因,首先性价比自不必说了。2080Ti 22G其实早在DeepSeek V3/R1这一波之前就广为人知;而新一轮DeepSeek对大模型应用平均参数量的提升,则助推了4090 48G 吧?
另一个原因,我想应该与禁令有关。之前在服务器上用A40、L40(48GB)的人不少,工作站上的RTX 6000 Ada如今也一样买不到了。虽然4090 D和RTX 5880算是开个“小口子”,但这也影响了人们对下一代GPU的信心,包括关于5090 D(32GB显存)的小道消息。
扩展阅读:《NVIDIA AI性能计算更正:为什么RTX 4090抢购,而工作站A6000相对乐观?》
而在我看来,5090 D硬件参数本身不是已经合规了吗,哪里超出限制了…
更多大显存GPU展望
像GeForce、Radeon这些消费级显卡,温度和故障率偏高的一个原因是功耗释放相对激进。还有一点,就是“非公版”的大尺寸散热器不利于在服务器中高密度部署——这个对显卡厂商其实并不是技术难题。工作站显卡,咱们先不谈那些图形性能优化啥的,用于AI计算场景,也算是游戏卡与服务器GPU之间折中的一个选择。
NVIDIA最新一代的工作站高端显卡RTX PRO 6000 Blackwell,把显存提高到了96GB。AMD对应的RDNA 4架构新品还没发布,按照常理也应该会提升显存容量吧?
与NV的RTX 4090相对应,AMD有一款24GB显存的Radeon RX 7900 XTX消费级显卡。而在Radeon Pro专业卡产品线中,则有3款48GB的型号,其中W7900包括Dual Slot和3插槽两个版本;W7800除了48GB还有款32GB显存的。
GPU厂商显然愿意卖毛利更高的产品,这样才有钱投入CUDA、ROCm软件生态的研发。所以我们看到,在5090之下,5080显卡仍然是16GB的——打游戏等倒是一般也够用了。
至于AMD方面,最新一代Radeon RX 9070 XT只有16GB,因为它本身对位的是NVIDIA的GeForce 5070系列。于是就有人猜测:AMD RDNA 4消费显卡会不会有一款更高的型号出现,无论是连同提高GPU的规格,还是只把显存增加到32GB。其实人们盼望的还是AI应用的高性价比,当然像常规显卡那样有不缩水的保修服务就更好了。
上图是在ROCm官方社区看到有人发的贴子,完全无责任猜想哈:)
扩展阅读:《企业存储技术》文章分类索引更新(微信公众号合集标签)
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage
长按二维码可直接识别关注
历史文章汇总:http://www.toutiao.com/c/user/5821930387/
http://www.zhihu.com/column/huangliang
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-04
通过MCP给Cherry Studio增加联网搜索能力
2025-04-04
A16z也玩RTX4/5090 来搭建穷鬼GPU机器
2025-04-03
“AI眼镜的终极功能,是AI+社交” | 对话影目科技创始人
2025-04-03
最牛的 AI 应用开发者,都在做 AI 浏览器
2025-04-03
理想车载大模型为什么不直接用deepseek?
2025-04-03
简单说说算力网络:阿里云万卡集群组网实战
2025-04-02
Manus升级了!让我们看看Manus最近都增加了哪些新功能!
2025-04-02
ChatBox:一个功能强大的AI模型Chat客户端,支持DeepSeek等多个模型
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-07-01
2024-06-23
2024-06-24
2025-02-12
2024-10-20
2024-06-08
2025-04-03
2025-03-30
2025-03-28
2025-03-26
2025-03-13
2025-03-12
2025-03-10
2025-03-10