我要投稿

可穿戴AI，底层逻辑的变化

发布日期：2024-07-06 07:58:02 浏览次数： 2435 作者：道明AI实验室

有多少人还记得这个小兔子？一个发布时爆火的AI设备：Rabbit R1。

或者，还有人记得AI Pin吗？

是的，进入AI时代，一切都在加速，新模型新产品出来的很快，热度衰退的速度一点都不亚于?的速度。所以，似乎，这两款产品也如同很多产品一样，迅速的消失在大众视野之外。

不过，作为Rabbit R1的首批用户，我如今还在用。虽然Rabbit还没完全交付当初承诺的那些功能，但是ota更新的频率依然挺高。这个产品也是目前唯一一个一边语音聊天一边还能看到字幕的量产产品，或者说，这是一个可以用到的功能比现在GPT-4O更接近GPT-4O发布会演示功能的量产产品（有点拗口）。

当然，这篇的目的不是为了介绍Rabbit R1，只是将其的功能作为引子，下面三段视频分别展示了搜索，内容交互，视觉理解能力。

虽然，在最早的介绍文章里，我就提出这个产品肯定还有很多瑕疵，更多只是验证（Rabbit R1，这个“味”对了）。但是，毫无疑问当初这个产品的推出给到了手机厂商和模型厂商足够多的提示，所以我们看到了GPT-4O，看到了Apple Intelligence。R1的功能当然手机可以做，但是如果不是这样的产品面世，手机厂商会这么快速的应对吗？

同样的道理，给到AI Pin。

然而，虽然手机可以做这个做那么，但是这段时间我还是研究了一系列可穿戴产品。

比如说，Meta联合Rayban推出的眼镜，可以有视觉和语音功能。

比如说，前两天介绍的智能项链Friend。Friend：又看到一个很有用但可能争议巨大额AI硬件

还有一些其他，这些产品都很有意思，但是估计每个都卖不多。

但是，如果把这些产品合起来看，可穿戴AI却开始成立了，这种成立，来源于底层逻辑的改变。

可穿戴设备不是个新鲜事物，但是在过去十年时间里，真正占据足够大市场的只有两个可穿戴设备：手表和耳机。甚至于，在这一轮AI起来的时候，大家都在预期是不是可以有AI手表，AI耳机。

现在看来，对了，又错了。对的是确实到了这个点，AI进入可穿戴设备的趋势几乎确定了，错的却是，这些设备并不能真正独立存在，甚至于，可能都不需要因为AI的进入而特别增加功能，或者，在实现原有功能+AI的范围内，系统设计可能反而简单了。

简单而言，底层逻辑的变化，就是面向用户的服务驱动方式产生了变化，从推荐算法到生成算法的巨大改变趋势已经显现出来了。

在移动互联网时代，推荐算法是核心驱动力，所有的服务，即使看起来app部署在手机上，也都是靠云端的个人数据驱动的。在这样的架构下，可穿戴设备只是完成一种在同等功能下形态的转换（非数字化到数字化），手机或者其他端侧设备的存在更多是管理和简单的数据计算功能，产品核心在于原功能的数字化改造，所以即使可穿戴，但是并没有出现真正有意义的新产品形态。

同时，用户数据主要在服务提供方处储存并处理，海量个人数据加持下的推荐算法一方面提升了“用户体验”另一方面靠流量变现让用户免费使用高质量服务，产生鼓吹的羊毛出在牛身上的故事。离开了“真实可靠”的用户数据，推荐算法光有躯壳，却没有血液，无法工作。同样的，推荐算法也只能跑在云端，因为只在本地处理每一个用户的算法也是没有意义的。

模型驱动下的生成式AI时代，则完全不同，经过训练好的模型本身就压缩了足够多的“知识”。一个在运行的模型对所有用户的输出理论上都是一样的（不同只是模型的随机性带来的），模型不需要用户数据就能跑出结果，用户数据也无法影响到正在运行的模型。实际上，目前看来用户私有数据对于模型训练的价值量也并不大（或者说，可能很有价值，但是当训练完毕后，对所有用户又都是本质相同的输出了）。

但是在用户使用中，情况又发生了变化，用户自然而然会产生更个性化的需求：匹配个人的语言风格、知识库、信息处理、内容生成，甚至通过agent自动完成各项工作。这些需要用户数据去激活经模型压缩过的某块知识区域（注意力机制），进行解压缩式的生成，无论是生成特定内容，还是完成特定任务。模型是脑，数据是肢体，用户数据的加载也就是某种形式的“具身”。这种数据加载，也就是苹果在WWDC发布会提到的Personal Context概念。

为了模型更个性化更精准的完成任务，就需要更具体的用户数据，同时，虽然云端模型依然最强大，但是端侧模型跨越及格线后，吸引力毫无疑问在快速提升。当跑在PC、手机的本地模型足以胜任绝大多数任务时，个性化与数据安全的需求就同时得到了满足：更好的体验下，数据所有权又交回给了用户（虽然这依然是需要一定时间完成的“故事”，但值得去说）。服务的载体逐渐从云走向端（但是这不会削弱目前云服务的价值，因为大规模的私有云计算依然还是会部署在最大的几家云服务商系统上，同样可以兼顾质量与安全），以端为计算核心的C端逻辑下，可穿戴设备或者说AI的定位自然产生了变化。

简单而言，就是可穿戴AI设备是一个数据采集器或者计算结果展示界面，或者两者兼顾。眼镜、手表、耳机就是最好的两者兼顾的设备，随时随地采集数据或者接受用户指令，回到用户端侧处理后，再以文字、声音或者图形图像的形式展示在设备之上；项链、戒指，甚至各种airtag就更多是采集设备。这种更清晰的定位可能在将来反而会大幅降低可穿戴设备技术上的复杂度，而更突出围绕端生态的支持能力、核心功能的能力和工业设计。

这些，我已经看到了雏型：Friend项链可以在设备上实时记录语音信息，这些数据可以无感知的交给模型处理（目前看，端侧能力已经足够了），重要事件提醒、计划制定、会谈纪要总结，直接的效率提升。其实这些功能在Rabbit R1里也都存在了，虽然目前以一种不让人放心的方式将所有的使用记录存放在云端的journal功能里（Rabbit R1的模型跑在云上，虽然厂商反复强调数据安全性，但是用户的信任应该是不高的），但是，如果同样的功能在一个用户可控的可穿戴设备上实现呢？这其实一点都不难。

每个人，总有工作提效的需求，有学习的需求，有社交的需求，有娱乐的需求，或者各种其他的奇奇怪怪的需求，这些，构成了我们的Personal Context。

这些，在生成式AI时代，从云走向端的C端底层逻辑变化下，或许正在开启一个五彩缤纷的可穿戴AI设备新时代。既然研发周期大幅缩短，既然试错成本快速降低，既然我们本就应该有很多好玩的小物件，那么，为什么不呢？

我喜欢AI Pin，Rabbit R1，Friend，Meta Rayban Glass，喜欢现在及未来所有出现的可以blowing mind的wearable devices。

虽然，十个可能活不了一个。

但这就是我们该有的放飞一切可能想象的世界啊。