我要投稿

体验完字节送的迷你AI硬件，后劲太大了...

发布日期：2025-04-26 10:05:36 浏览次数： 1525 作者：袋鼠帝AI客栈

大家好，我是袋鼠帝

最近也是好起来了，上周四去杭州参加了字节火山的线下meetup开发者大会。

在会议现场亲自体验了他们这次新发布的大模型和产品，整个过程还挺有意思的。

我们那一组甚至还因为提了最多的宝贵意见而获得了一等奖（是一个火山的玩偶）

火山方舟这次带来了不少有意思的产品：

1.全新的豆包思考模型Doubao-1.5-thinking-pro和豆包视觉模型Doubao-1.5-vision-pro；

2.MCP应用 - DeepSearch，可以接入丰富的MCP工具，专为复杂问题而生；

3.方舟 x RTC硬件，打造AI硬件的一站式解决方案；

4.火山方舟应用实验室开源生态。

说实话，体验下来效果都很不错。

先说说豆包思考模型Doubao-1.5-thinking-pro

它不仅效果好，延迟低，还支持多模态（拥有视觉能力）

模型支持的并发和价格都非常香～

因为智能体客户对模型API请求量有要求，我之前刻意对比过，发现火山应该是目前大模型API里面支持并发最高的平台了

支持每分钟3万次请求和500万tokens，比其他平台高了不止一个数量级

视觉模型Doubao-1.5-vision-pro也非常nice

我搞了一张杰伦哥的照片，问它在不在合照里面，它居然没上当。

然后我把自己的照片发给它，问它我在合照的位置。

看到回复的结果，我当时一下子鸡皮疙就起来了！它真的知道...

虽然目前还无法准确的判断出在第几排，第几个，但已经很强了。

以上两个模型都可以在火山方舟的模型广场体验。

随后是MCP应用-DeepSearch：是一款专为处理复杂问题而精心设计的高效工具（边思考，边选择合适的MCP工具完成任务）。

下面是它的架构图

现场体验，感觉效果真心不错。

有兴趣的朋友可以访问火山方舟->模型广场，第一个应用就是DeepSearch

https://console.volcengine.com/ark

但目前只支持内置的几个MCP，自由度差了一些（官方透露最近会支持外接MCP）可以先期待一波。

对我来说，最新奇、最特别、最爱不释手的还是他们展示的最新AI硬件一站式解决方案。

这个AI硬件就是下图桌子上这堆，当时还有群友在问能不能都打包回来?

我确实打包了

但弱水三千，只取一瓢，搞一个够用了（拆开包装，就下图这个mp3大小的玩意儿）

别看这个玩意儿这么小一点点，但蕴含大大的能量，我真的太爱它啦！！

其实去年我就分享过一篇关于AI玩具的文章。那篇分析了AI玩具的整个工作原理。

在今年的3月份，我又分享了一篇用DeepSeek拯救我的小米音箱(小爱同学)的教程。

阅读量挺不错，原来大家都想拯救小爱同学呀～

拯救我的小爱同学
袋鼠帝，公众号：袋鼠帝AI客栈小米音箱+DeepSeek，小爱秒变"贾维斯"！【喂饭级教程】

直到我体验了这个火山方舟 RTC 与嵌入式芯片厂商合作的Demo产品：AtomS3R 开发板

我想通了：小爱同学，除了雷总，谁也拯救不了

思路打开，换个更好用、更丝滑的AI产品不就好了嘛。

先看个我录的视频，你就知道它的牛逼之处了

咱们先重点关注AI硬件效果。模型的回复效果，支持自己DIY（别急，后面有讲）

它真的太特喵流畅了

毫秒级实时响应，实时打断，再实时接话，仿佛在跟一个真人通话一样。

下图是官方给出的功能说明

而且体验下来，它完全解决了我的一大痛点：

小爱同学会经常在我玩PUBG战况激烈的时候，突然答腔，这点真的非常令人烦躁（喜欢玩枪战游戏的铁子应该懂，要听脚步）

平时也会莫名其妙出声，关键是本身是有“小爱同学”作为唤醒词的，但完全不管用。

AtomS3R 开发板非常牛逼的一点就是，即便没有唤醒词（代表随时都可以唤醒），只要我不对他说话，它就不会回复（我测试了，在它旁边打box，吹口哨，弄出各种奇怪的声音，都没用）。

心无旁骛，完全不受噪音干扰。

查了一下官方资料，这得益于火山通过 RTC SDK 实现了对复杂环境的音频降噪能力，有效降低背景噪音、背景音乐的干扰，从而提高用户语音打断的准确性。

你可能会说，这有啥，OpenAI的ChatGPT App上面不是早就有了吗？

但是OpenAI，他Open吗，而且它延迟挺明显的。

说实话，如果那天现场体验的是一个成熟的产品，我可能反而并不会太兴奋。

就因为这玩意儿，它从客户端代码，到服务端程序都是开源的！才更令人兴奋呀

整个体验也都是在我本地搭建起来的，只不过大模型和TTS的功能调用了火山引擎的API接口。架构图如下

开源Demo地址：

https://github.com/volcengine/rtc-aigc-embedded-demo.git

并不是因为它免费。

而是，这意味着，我们完全可以自己DIY这个AI硬件。

比如给它赋予自定义的性格、角色。

切换不同音色、甚至使用克隆音色（比如周董、志林姐姐...）

接入搭载AI知识库的Agent（智能体），有问题，随时用嘴问，回答更专业。

接入搭载各种MCP的Agent，用嘴玩MCP，打造真听话AI等等...

更有意思的是，它跟mp3一样大，完全可以随身携带，如果再让它通过耳机回复，有没有一种萧炎随身带着药老的感觉？

想想都觉得美滋滋～

虽然它现在还只是一个开发板，但我仿佛已经看到了智能玩具、智能家居、智能穿戴设备、智能教育设备、AI 机器人等领域美好的未来。

不过有一点不得不吐槽一下，在本地搭建这套AI硬件的一站式解决方案，还真挺费劲的（主要还是对硬件/嵌入式开发这块生疏了）。

看下面的流程你就知道了

即便火山给了一个操作文档，但我也还是耗费了不少时间

中途也遇到不少问题，还专门请教了火山的开发同学，才搞定。

最后，大家应该也注意到了这个AI硬件其实还长了个摄像头，这意味着它是可以实时捕捉画面的（长了个眼睛）

官方反馈视觉理解这块还暂未支持，但已经在计划中～

不敢想象一个能听会说、还会看的专属DIY Agent硬件有多棒，先狠狠期待一波。

独乐乐不如众乐乐，我准备后续单独出一篇详细的本地搭建、DIY教程。

这款AI硬件的获取方式，在评论区见。

可以先给个免费的三连支持一下，你们的支持是我的动力～

想提前体验的朋友也可以先去火山方舟的实时音视频试用：

https://console.volcengine.com/rtc/guide

另外，本地搭建这套AI硬件一站式方案，也需要调用到火山方舟的一些API接口（大模型、TTS等）

有的朋友可能会担心费用问题

说实话，目前很多调用大模型API的业务，我都用火山方舟了。

因为火山方舟是字节旗下，算力足且稳定，大模型延迟低，API支持的并发还非常高，价格也实惠，所以在之前就一直给我的智能体客户们推荐了（虽然是用我的额度）

下图是我和部分智能体客户最近一个月的火山大模型API用量：超过880万tokens

因为要给客户使用火山API嘛

我记得我就二月份第一次在火山充值了100元，用到现在都还剩84元...

火山会赠送很多免费tokens额度

所以还是很耐用的，可以放心冲。

你想如何DIY这套AI硬件呢，欢迎评论区分享～

能看到这里的都是凤毛麟角的存在！

如果觉得不错，随手点个赞、在看、转发三连吧~

如果想第一时间收到推送，也可以给我个星标⭐

谢谢你耐心看完我的文章~

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

AI陪伴硬件企业必看：声网如何助力Robopoet打造下一代AI陪伴硬件｜案例研究

2025-04-25

上手了字节的AI硬件，有点爽

2025-04-25

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

扣子，无限生产海量 MCP

2025-04-25

产品经理有福了：利用AI直接生成原型图&UI设计图

2025-04-24

方案 | 基于本地大模型开发CAD智能助手

2025-04-24

Fellou AI浏览器体验报告，它是未来AI应用的雏形

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

大模型训练及推理【硬件选型指南】及 GPU 通识

2024-05-09

华为昇腾910B与英伟达B200性能对比

2024-07-23

【不看后悔】一文梳理端侧模型和小模型

2024-07-07

一文带你看懂英伟达A100、H100、A800、H800、H20系列

2025-02-12

NVIDIA消费级显卡4060/4090 AI训练能效比较

2024-07-01

对比A100和4090：两者的区别以及适用点

2024-06-24

私有化部署大模型非常重要环节：国产显卡和英伟达显卡到底该如何选择？

2024-06-23

手把手教你免费把AI大模型接入小米音箱，无需任何代码基础，小白级基础详细操作教程！

2024-10-20

小爱音箱大变身：接入 ChatGPT 和豆包，轻松打造专属 AI 语音助手！

2024-06-08

大家都在问

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

爆火的扣子空间里，藏着什么秘密？

2025-04-21

AI与自动化实战：n8n、Dify、Coze哪个更适合我们？

2025-04-13

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-11

理想车载大模型为什么不直接用deepseek？

2025-04-03

JetBrains Junie 内测体验，能否挑战 Cursor？

2025-03-30

Tavily MCP Server深度解析：如何用Cline打造智能搜索神器？

2025-03-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB