我要投稿

英伟达新品“掌心AI超算”，¥1800跑8B多模态模型，算力暴增70%价格腰斩

发布日期：2024-12-18 23:34:01 浏览次数： 1886 作者：量子位

“英伟达版树莓派”这波良心了，性能涨70%，降价50%。

老黄召开厨房发布会，从烤箱里端出这台“掌心AI超算”。

‍

△怎么不穿皮衣了

新版Jetson Orin Nano开发版套件，算力从40 TOPS涨到67 TOPS（INT8），内存带宽增加50%，达到102GB/s，功耗仅25瓦。

价格却降了50%，从$499降到$249（约人民币1800元）。

67 TOPS什么概念？

比目前英特尔、AMD或高通AI PC中的大部分NPU都快
能跑主流的7B、8B大模型量化版，如阿里Qwen，Llama等‍
最高支持4个摄像头，也能跑8B的视觉语言模型和ViT模型

英伟达称这是“最实惠的生成式AI超级计算机”。

无论是用来创建基于RAG的聊天机器人、视觉AI Agent，还是部署基于AI的机器人，都是理想的解决方案。

开发套件包括一个Jetson Orin Nano 8GB系统级模块（SoM）和一个参考载板，可用于边缘AI应用的原型设计，功耗最高25w。

采用6核Arm CPU和NVIDIA Ampere架构GPU，GPU配备1024个CUDA核心和32个张量核心，支持多个并发AI应用管道和高性能推理。它最多可以支持4个摄像头，提供比以前版本更高的分辨率和帧率。

The Register估计在运行4位量化版Llama 3.1 8B模型时，能达到约18-20 tokens/s的速度。

Jetson支持一系列英伟达AI软件，包括用于机器人的NVIDIA ISAAC、用于视觉AI的NVIDIA Metropolis 和用于传感器处理的NVIDIA Holoscan。

另外可以使用NVIDIA Omniverse Replicator生成合成数据，并使用NVIDIA TAO工具包微调预训练模型，可以缩短开发时间。

老黄称这个系列为一种全新的处理器——机器人处理器。

推出第一代产品时，没人理解英伟达在做什么
到现在，它已经支持了各种机器人，带轮子的、两条腿的、三条腿的。

额外的好消息是，新推出的软件更新，也将为买过旧版开发套件的用户带来生成式AI性能提升。

有网友表示，黄仁勋就是新的圣诞老人。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-19

4090/4090D 的48G版本是怎么来的

2025-04-18

简单好用的AI助手AingDesk

2025-04-18

Cursor 轻松集成 Supabase MCP 服务

2025-04-18

DroidRun：解锁AI手机自动化

2025-04-17

Google的AI防护方案-AI Protection

2025-04-17

复刻小智AI第2步，2张核心流程图学习一下它的WebSocket协议

2025-04-17

转型 AI 公司后，理想交出首份成绩单

2025-04-17

Google A2A：开启Agent相互协作的新时代

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

大模型训练及推理【硬件选型指南】及 GPU 通识

2024-05-09

华为昇腾910B与英伟达B200性能对比

2024-07-23

【不看后悔】一文梳理端侧模型和小模型

2024-07-07

一文带你看懂英伟达A100、H100、A800、H800、H20系列

2025-02-12

NVIDIA消费级显卡4060/4090 AI训练能效比较

2024-07-01

对比A100和4090：两者的区别以及适用点

2024-06-24

私有化部署大模型非常重要环节：国产显卡和英伟达显卡到底该如何选择？

2024-06-23

手把手教你免费把AI大模型接入小米音箱，无需任何代码基础，小白级基础详细操作教程！

2024-10-20

小爱音箱大变身：接入 ChatGPT 和豆包，轻松打造专属 AI 语音助手！

2024-06-08

大家都在问

AI与自动化实战：n8n、Dify、Coze哪个更适合我们？

2025-04-13

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-11

理想车载大模型为什么不直接用deepseek？

2025-04-03

JetBrains Junie 内测体验，能否挑战 Cursor？

2025-03-30

Tavily MCP Server深度解析：如何用Cline打造智能搜索神器？

2025-03-28

Claude Desktop- AI大模型+MCP Server结合，能够带给你哪些无限可能？

2025-03-26

罗永浩的AI新战场，能否打破“行业冥灯”魔咒？

2025-03-13

Mac Studio 首发实测：10 万块的顶配 Mac，能跑满血版 DeepSeek 吗？

2025-03-12

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB