微信扫码
与创始人交个朋友
我要投稿
前言,从去年(2023年)年初到现在H100整机产品一直是智算中心市场需求最多、采购占比最高的训练型GPU服务器,因为单台H100整机可提供半精度FP16的8P稠密算力,性能领先,1000P训练集群的标配就是128台H100整机,但是很多朋友注意到了目前H100整机的市场价格“差距很大”,比如从21x万到25x万、26x万不等,不都是基于HGX H100模组的产品吗?是什么因素导致的价格差呢?我们从如下6个方面简单聊聊。
一、H100整机的配置不同
我们都知道H100整机除了HGX H100模组是英伟达统一的产品,其他的配置都是可以灵活配置的,比如CPU是选择五代还是四代,是8558还是8468、8480?内存是32条是否满配32x64G的DDR?U.2的NVme是否配置,配置了几块是3.84T还是7.68T,CX7的网卡是否是8张满配,是否配置了BFD-3的DPU等等,即使是同一品牌、同一批次的产品,如果配置上不同,价格上也会有差距。
二、H100品牌对价格的影响较大
目前市场上最常见的H100整机品牌有超微、技嘉、Dell、华硕、HP等,大概有十来家,不同品牌的产品出货量也是差别很大,主要区别是在产品的成熟度(和故障率有关)、产品形态(4U、6U还是8U等)、风冷还是液冷散热等,超微在这个方面一直是客户认可度相当较高的,所以价格也是相当较高的,常见一些采购规模不是很大的客户指名就要超微的情况。
三、期货还是现货,价格差距很大
H100这类设备价格非常贵,单台就有200多万,要想现货备货对资金方面的压力非常大,我们从客户需求的紧迫度来看,可以选择现货还是期货,现货也分为国内现货和国外现货和准现货,里面门道很多,期货又分为短期还是长期期货,价格差距也非常大,现货的风险相对小供货快,但是价格要更高,期货有供货周期风险相对较大,但是价格更便宜。
四、整机原装还是机头+模组
很多客户或者供货商为了追求极致的低价,会以机头(服务器平台)+模组(HGX模组)的形式采购,相比整机采购从价格上更低,因为整机可选的品牌更多,机头也是一样,但是风险是需要自行组装,毕竟是高价值产品,对组装的工艺要求也很高,一是组装过程中可能出现损坏,二是在使用过程中一旦出现问题需要判断是机头还是平台原因,可能会增大故障判断的难度和售后维修的周期。
五、“二手”货和全新货
虽然H100属于比较新、比较主流的高端训练GPU服务器,但距离英伟达正式发售也有2年多了,最早一批的用户可能也已经用了快2年了,很多智算中心在建设之初会将设备抵押贷款,运营出现问题时设备面临被抵债的风险,这个时候就有可能作为二手机器流向市场,价格也更低,和H100比A100、A800这类型号的二手整机相对更多,因此在验机时要判断是否是二手产品,不能图便宜。
六、质保和服务条款也很重要
这类H100设备故障率要普遍高于普通服务器,个人认为是和GPU芯片模组设计以及日常运行的高负载有关,因此在设备采购时要看价格里是否带产品质保和服务时效,是原厂质保还是供应商本地就能质保,售后维修的时效长短等,大批量采购的客户往往也需要考虑本地的备品备件。
影响H100整机价格的因素还有很多,今天只列出来几个常见的,大家知道还要哪些欢迎评论区留言讨论。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-05-09
2024-07-07
2024-07-01
2024-06-24
2024-07-23
2024-06-08
2024-06-05
2024-06-21
2024-07-11
2024-11-12
2024-11-11
2024-10-29
2024-10-22
2024-10-18
2024-10-16
2024-10-15
2024-10-10