我要投稿

GPU/NPU/TPU区别到底在哪里

发布日期：2024-07-01 22:36:01 浏览次数： 3437 作者：科技词话

GPU

graphics processing unit（图形处理单元）通常被称为"显卡"，目前主要分为两大类：一类是专门用于图形和图像处理的传统显卡；另一类是为人工智能计算提供加速的专用加速卡。随着大模型和AIGC浪潮的星兴起，GPU已经成为了新时代的IT基础设施，英伟达也借着GPU风靡全球的东风，登上了美股第一的宝座。

NPU

neural processing unit（神经处理单元）是专为机器学习领域中神经网络的计算需求而设计的处理器，如卷积、点积和矩阵运算等。由于当前大多数AI技术都基于神经网络，NPU可以视为一种针对AI计算优化的加速卡。

TPU

TPU，Tensor Processing Units（张量处理单元）是一种针对人工智能训练中多维数据（张量）处理而设计的处理器。谷歌开发的TPU在概念上与NPU相似，也是一种为AI计算提供加速的专用硬件。

2013年，谷歌内部的图像搜索、谷歌照片、谷歌云视觉API、谷歌翻译等多款产品和服务都需要用到神经网络，为了设计一款能够加速谷歌自身业务的专用芯片，谷歌内部开始了TPU研发，并在2015年6月的I/O大会上推出了自己的第一代TPU。随后在 2017 年又研发了第一款 Cloud TPU。

目前，Google CLoud上主推Cloud TPU v5p和Cloud TPU v5e两款GPU，并在近期上线了了第六代TPU Trillium。相较于上一代的TPU v5e，Trillium TPU的单芯片峰值计算性能实现了4.7倍的显著提升。在内存方面，Trillium TPU的高带宽内存（HBM）容量和带宽均翻了一番，同时芯片间互连（ICI）的带宽也得到了成倍增强。

Trillium TPU搭载了第三代SparseCore，这是一种专为处理大规模嵌入而设计的专用加速器，常见于高级排名和推荐系统中。这使得Trillium TPU能够以更快的速度训练下一代的基础模型，同时以更低的延迟和成本提供服务。Trillium TPU的另一个关键优势是其卓越的能效比，比TPU v5e节能超过67%，在可扩展性方面，Trillium TPU能够支持单个高带宽、低延迟的pod扩展至256个TPU。此外，利用多切片技术和Titanium智能处理单元（IPU），Trillium TPU的扩展能力可以跨越数百个pod，通过每秒多PB级的数据中心网络互连，连接到楼宇规模的超级计算机中，实现数万个芯片的协同工作。

总结

GPU、NPU和TPU只是不用时期不同公司对于AI计算单元不同称谓，比如，昇腾910系列的称呼，有多种说法：一些人称之为NPU，随着GPU定义的扩展，也有人称之为GPU；还有人称其为SoC（片上系统），因为昇腾910不仅包含AI计算模块，还集成了CPU等其他组件。

目前来看，TPU是谷歌自己在玩，NPU基本上推出历史舞台，我查看了国内几大云厂商的官网，除了腾讯云还有个别NPU的机型，其他云厂商基础已经下线，后面将由GPU一统江湖。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

一篇文章说清楚什么是生成式AI、决策式AI、判别式AI

2025-04-27

字节Trae 大更新，5分钟看懂AI生成的“神秘代码块”

2025-04-27

字节新出的MCP应用DeepSearch，有点意思。

2025-04-27

用百度网盘MCP在Cursor中构建私人网盘助手，太香了叭（附搭建教程）

2025-04-27

实测免费DeepResearch！轻量版深夜上线，基于o4-mini，速度更快/重视脉络梳理

2025-04-27

Dify → 问题分类|条件分支

2025-04-26

接入SpringAI实现流式对话

2025-04-26

MCP超市：百度上线AI开放计划

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部