我要投稿

黑神话悟空火了，为何没人用H100打游戏?（盘点H100和4090的十点区别）

发布日期：2024-09-07 13:04:18 浏览次数： 2700 作者：吃果冻不吐果冻皮

一、为何没人用H100打游戏？

智算中心建设的火爆不仅带火了H100而且还大量采购了4090的GPU服务器，主要原因是H100在训练侧最具性价比，而4090在推理侧最具性价比。最近几天国产3A大作黑神话悟空火了，同样拉升了4090这类gpu的销量，但是为何没人用H100来打游戏呢？

大家通常考虑的点有如下三个，是这样吗？

有人说是价格，有人说是视频输出接口，有人说是驱动？

假如，我说假如把H100的价格打到4090一样，同时给它开发游戏驱动，也配置视频输出接口，它能替代4090吗，答案是否定的，接下来我们从十个方面分析两者的区别，看完你就明白为何H100这类gpu打不了游戏了。

二、H100和RTX 4090的10点区别

老张从多个角度（数据中心和游戏玩家的角度），独家梳理了H100和RTX 4090 GPU的10个区别点，分别为：厂商的产品定位、价格、产品外观、游戏特性、GPU和GPGPU、单卡算力、芯片结构、多卡互联、销售模式、禁售后阉割程度。

1、产品定位不同

RTX 4090：面向消费级市场产品，受众是打游戏的ToB用户。RTX好比方是跑车，虽然速度非常快，面向单个玩家，主打的就是可玩性高。

H100：面向数据中心、企业级市场，做人工智能大模型训练、HPC等领域的ToC用户。而H100更像是高铁，主打商务，快是基础，另一方面更注重稳定可靠。

2、单卡价格差距10倍以上

一张RTX 4090市场价，1.3-1.6W

一张H100 PCIe卡在22W左右，八卡HGX模组210W

3、产品外观差异很大

RTX4090：主要可分为公版和非公版、以及风扇版和涡轮版，风扇版外观五花八门

H100：有2种形态：H800 SXM和PCIe

4、游戏特性方面差距大

RTX4090支持全新DLSS 3 技术（高级游戏特性），3 代 RT Core的光线追踪性能较上一代大幅提升，H100无游戏特性相关的设计，视频输出接口也没有。

5、单卡算力差距

RTX 4090的基本参数如下，其中FP16的算力330Tflops，个人分析应该是稀疏后的，稠密算力实际为160Tflos，不少公开的算力租赁平台显示4090 FP16算力160Tflops

这里说明稍微有点问题：
如果使用使用FP32 Accumulate则峰值的稠密算力为165Tflops，如果使用FP16 Accumulate则峰值的稠密算力为330Tflops。由于大多数时候进行模型训练和推理时采用的是混合精度，即使用BF16或FP16进行矩阵乘，然后用FP32 累加，所以显示的165Tflops的样子。

这里我们用H800来举例子

6、GPU的类型不同

从显卡演进的角度，4090属于全功能GPU，而H100属于GPGPU，通用GPU，阉割了图像显示相关的核心，把GPU芯片的空间都让给计算核心了

7、芯片结构差异大

RTX 4090属于Ada Lovelace 架构，16384 个 CUDA 核心，由128个SM组成，单个SM如下图：

H100则为Hopper架构，16896个CUDA核心和528个4.0Tensor核心，阉割了对图像渲染至关重要的光追核心（RT Core）。这个是H100无法打大型3A游戏的关键。H100 132 个SM，单个如下：少了RT core，多了FP64的处理单元。

8、多卡互联设计

4090不支持GPU Direct，也就是GPU间无法直接通信，必须通过CPU中转，而H100支持GPU Direct，可以借助Nvlink相关技术或者芯片进行卡间高速通信，支持RDMA、GDS（GPU存储直接访问）；

9、禁售后的阉割比例

4090很不幸达到了最新一期的限供标准，替代品为4090D，D的寓意为龙的英文，玩家戏称为Dog，弟弟；综合性能相当于4090性能的95%，差别并不大，有博主评测和4090在游戏方面差距很低，只有2%左右。参数变化见下图：

H100的阉割版为H800，阉割了面向高性能计算的FP64，以及卡间通信的带宽（由900GB/s降低至400GB/s），虽然后续又推出了H20的新阉割版恢复了卡间互联通信速率以及增加显存，但是综合算力的性能方面仅为H100的20-30%；

10、销售模式有差异

RTX4090产品在服务器大厂那里是严禁销售的（与英伟达有协议），可通过各类ToC的渠道或者代理公司买到，整体比较随意，二手平台也不少见。

H100的销售则是以服务器厂商和专门做GPU卡代理公司为主（以浪潮为例，每年从英伟达的芯片采购都是百亿人民币级别），小部分也通过电商平台，用户更看重质保和售后。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-24

Fellou AI浏览器体验报告，它是未来AI应用的雏形

2025-04-23

DeepSeek 32B随便跑,万元超值组装AI大模型电脑主机

2025-04-23

扣子空间：当「AI实习生」开始主动对齐，人机协作的「共生进化」和「双向奔赴」

2025-04-21

微软Playwright MCP 服务器为LLM提供浏览器自动化能力

2025-04-21

爆火的扣子空间里，藏着什么秘密？

2025-04-20

Dia之后，Fellou是我非常推荐的又一AI浏览器

2025-04-20

实测扣子刚刚上线的新版扣子空间。自动化解放人类越来越近了。

2025-04-19

4090/4090D 的48G版本是怎么来的

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

大模型训练及推理【硬件选型指南】及 GPU 通识

2024-05-09

华为昇腾910B与英伟达B200性能对比

2024-07-23

【不看后悔】一文梳理端侧模型和小模型

2024-07-07

一文带你看懂英伟达A100、H100、A800、H800、H20系列

2025-02-12

NVIDIA消费级显卡4060/4090 AI训练能效比较

2024-07-01

对比A100和4090：两者的区别以及适用点

2024-06-24

私有化部署大模型非常重要环节：国产显卡和英伟达显卡到底该如何选择？

2024-06-23

手把手教你免费把AI大模型接入小米音箱，无需任何代码基础，小白级基础详细操作教程！

2024-10-20

小爱音箱大变身：接入 ChatGPT 和豆包，轻松打造专属 AI 语音助手！

2024-06-08

大家都在问

爆火的扣子空间里，藏着什么秘密？

2025-04-21

AI与自动化实战：n8n、Dify、Coze哪个更适合我们？

2025-04-13

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-11

理想车载大模型为什么不直接用deepseek？

2025-04-03

JetBrains Junie 内测体验，能否挑战 Cursor？

2025-03-30

Tavily MCP Server深度解析：如何用Cline打造智能搜索神器？

2025-03-28

Claude Desktop- AI大模型+MCP Server结合，能够带给你哪些无限可能？

2025-03-26

罗永浩的AI新战场，能否打破“行业冥灯”魔咒？

2025-03-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部