微信扫码
添加专属顾问
我要投稿
一、为何没人用H100打游戏?
智算中心建设的火爆不仅带火了H100而且还大量采购了4090的GPU服务器,主要原因是H100在训练侧最具性价比,而4090在推理侧最具性价比。最近几天国产3A大作黑神话悟空火了,同样拉升了4090这类gpu的销量,但是为何没人用H100来打游戏呢?
大家通常考虑的点有如下三个,是这样吗?
有人说是价格,有人说是视频输出接口,有人说是驱动?
假如,我说假如把H100的价格打到4090一样,同时给它开发游戏驱动,也配置视频输出接口,它能替代4090吗,答案是否定的,接下来我们从十个方面分析两者的区别,看完你就明白为何H100这类gpu打不了游戏了。
二、H100和RTX 4090的10点区别
老张从多个角度(数据中心和游戏玩家的角度),独家梳理了H100和RTX 4090 GPU的10个区别点,分别为:厂商的产品定位、价格、产品外观、游戏特性、GPU和GPGPU、单卡算力、芯片结构、多卡互联、销售模式、禁售后阉割程度。
1、产品定位不同
RTX 4090:面向消费级市场产品,受众是打游戏的ToB用户。RTX好比方是跑车,虽然速度非常快,面向单个玩家,主打的就是可玩性高。
H100:面向数据中心、企业级市场,做人工智能大模型训练、HPC等领域的ToC用户。而H100更像是高铁,主打商务,快是基础,另一方面更注重稳定可靠。
2、单卡价格差距10倍以上
一张RTX 4090市场价,1.3-1.6W
一张H100 PCIe卡在22W左右,八卡HGX模组210W
3、产品外观差异很大
RTX4090:主要可分为公版和非公版、以及风扇版和涡轮版,风扇版外观五花八门
H100:有2种形态:H800 SXM和PCIe
4、游戏特性方面差距大
RTX4090支持全新DLSS 3 技术(高级游戏特性),3 代 RT Core的光线追踪性能较上一代大幅提升,H100无游戏特性相关的设计,视频输出接口也没有。
5、单卡算力差距
RTX 4090的基本参数如下,其中FP16的算力330Tflops,个人分析应该是稀疏后的,稠密算力实际为160Tflos,不少公开的算力租赁平台显示4090 FP16算力160Tflops
这里说明稍微有点问题:
如果使用使用FP32 Accumulate则峰值的稠密算力为165Tflops,如果使用FP16 Accumulate则峰值的稠密算力为330Tflops。由于大多数时候进行模型训练和推理时采用的是混合精度,即使用BF16或FP16进行矩阵乘,然后用FP32 累加,所以显示的165Tflops的样子。
这里我们用H800来举例子
6、GPU的类型不同
从显卡演进的角度,4090属于全功能GPU,而H100属于GPGPU,通用GPU,阉割了图像显示相关的核心,把GPU芯片的空间都让给计算核心了
7、芯片结构差异大
RTX 4090属于Ada Lovelace 架构,16384 个 CUDA 核心,由128个SM组成,单个SM如下图:
H100则为Hopper架构,16896个CUDA核心和528个4.0Tensor核心,阉割了对图像渲染至关重要的光追核心(RT Core)。这个是H100无法打大型3A游戏的关键。H100 132 个SM,单个如下:少了RT core,多了FP64的处理单元。
8、多卡互联设计
4090不支持GPU Direct,也就是GPU间无法直接通信,必须通过CPU中转,而H100支持GPU Direct,可以借助Nvlink相关技术或者芯片进行卡间高速通信,支持RDMA、GDS(GPU存储直接访问);
9、禁售后的阉割比例
4090很不幸达到了最新一期的限供标准,替代品为4090D,D的寓意为龙的英文,玩家戏称为Dog,弟弟;综合性能相当于4090性能的95%,差别并不大,有博主评测和4090在游戏方面差距很低,只有2%左右。参数变化见下图:
H100的阉割版为H800,阉割了面向高性能计算的FP64,以及卡间通信的带宽(由900GB/s降低至400GB/s),虽然后续又推出了H20的新阉割版恢复了卡间互联通信速率以及增加显存,但是综合算力的性能方面仅为H100的20-30%;
10、销售模式有差异
RTX4090产品在服务器大厂那里是严禁销售的(与英伟达有协议),可通过各类ToC的渠道或者代理公司买到,整体比较随意,二手平台也不少见。
H100的销售则是以服务器厂商和专门做GPU卡代理公司为主(以浪潮为例,每年从英伟达的芯片采购都是百亿人民币级别),小部分也通过电商平台,用户更看重质保和售后。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-04
AI大会见闻:当“魔改”显卡开始摆上台面
2025-04-03
“AI眼镜的终极功能,是AI+社交” | 对话影目科技创始人
2025-04-03
最牛的 AI 应用开发者,都在做 AI 浏览器
2025-04-03
理想车载大模型为什么不直接用deepseek?
2025-04-03
简单说说算力网络:阿里云万卡集群组网实战
2025-04-02
Manus升级了!让我们看看Manus最近都增加了哪些新功能!
2025-04-02
ChatBox:一个功能强大的AI模型Chat客户端,支持DeepSeek等多个模型
2025-04-02
爆火的DeepSeek一体机,更多满足的是情绪价值|甲子光年
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-07-01
2024-06-23
2024-06-24
2025-02-12
2024-10-20
2024-06-08
2025-04-03
2025-03-30
2025-03-28
2025-03-26
2025-03-13
2025-03-12
2025-03-10
2025-03-10