我要投稿

「硬碰硬」：AI+硬件的神话，到底会怎么展开？

发布日期：2024-06-29 12:04:22 浏览次数： 2478 作者：极客公园

未来是一个超级智能体，还是多个有限智能体？

作者 | Founder Park

杨健勃是一位消费级硬件创业者，可以科技，他们开发的 AI 陪伴宠物在全球有着不错的市场表现。

阳萌，安克创新的创始人，市值 380 亿美元消费电子的硬件上市公司 CEO，也是可以科技的投资人。

Base 在北京的杨健勃经常飞到深圳与阳萌交流，他们常常围绕各自的业务，所在的行业，以及未来想做的事，展开非常深度的探讨。某种程度上，阳萌是杨健勃的「创业导师」。

我们有幸邀请到两位，在 AGI Playground 2024 大会上，选择一些命题，向大家呈现他们日常交流的片段。

以下内容来自阳萌和杨健勃在 AGI 大会上的对话，Founder vs Founder，经 Founder Park 编辑整理。

对话嘉宾：

阳萌 - 安克创新创始人 & CEO

杨健勃 - 可以科技创始人 & CEO

「充电宝公司」的 CEO，

上一份工作也是干 AI 的

阳萌：最近我们想吸引一些 AI 的人才，所以像我这种平时不太想出来的人，最近也做了几场访谈，包括跟 B 站 up 主的访谈，聊了一些对大模型、英伟达的理解。然后底下就有很多评论说，「这个年头连个卖充电宝的公司都出来谈模型了」。（笑）

有没有可能，其实这个充电宝公司的 CEO 上一份工作也是干 AI 的？我本科是计算机专业的，博士读到一半跑了，然后在谷歌做了五年半的机器学习。（阳萌对于 AI 的思考，可以参考此前 Founder Park 的直播稿件。）

安克今天不只是个充电宝公司，充电宝的业务只占我们整体 10% 左右的收入。

杨健勃：目前安克也有一些新的战略布局，包括 AI 这方面。首先我想问下 Steven，安克是什么时候意识到大模型或者甚至是 AI 这件事情应该成为非常重要的战略的？

阳萌：我们整个业务里就有一大块跟智能家居相关，我们有大概 100 个算法工程师，其中 30 多个音频算法，20 多个视频的，还有 40 多个工程师在做扫地机器人相关的 AI 算法。

我读博士的时候就在做机器学习。那个时候和现在很不一样，需要一个一个问题去解题，每一个问题都需要开发单独的 AI 算法。所以后来看到 GPT 的时候就觉得这个会改变未来，因为它不尝试去解决任何一个具体问题，而是通过底层模型的创新，就把一大堆问题解决了。

我们在跟 OpenAI 的同学交流的时候，大家会有这样一个比喻：以前一个一个问题解决的时候像是在造山。你在每个领域里面都要一座山，目的是为了在这个领域里登天。

现在有点像是在造海，就是海平面每提高一次，所有的问题都离天更近一些。这个比喻背后，有点达尔文自然进化的感觉。

今天大多数的 AI 从业者还在造山，但实际上你造山的速度已经很有限了，海追的速度却非常快。每次 OpenAI 一升级，就会发现很多造山的人的工作空间消失了，因为海已经漫上来了。

那个时候我就觉得，未来应该来了。

手机之外，

还需要新的核心硬件吗？

杨健勃：这种能力的变化或许也能赋能硬件。你觉得一个年销量 1000 万的 AI 硬件应该具备什么条件？上一个移动互联网时代的硬件核心是手机，耳机、手表等等品类围绕着手机展开千万级销量。你觉得 AI 时代还会围绕手机吗？

阳萌：我们先抽象一下这个问题。以今天大家使用 GPT 的方式，在工作/效率的场景里面，是不是需要一个全新的设备？

杨健勃：目前的话，作为交互媒介，PC 已经很高效了。

阳萌：对，当谈到效率场景交互的时候，首先要有一个很清楚、很大的显示；然后你要跟这个显示中的很多元素交互。客观地讲，在人机交互这个问题上，我觉得今天没有别的东西比手机做得更好，眼镜、AI Pin 或者任何其它设备，它的交互效率都没有手机好。

杨健勃：除了交互效率的问题，还有一点，手机其实承载了大量的社交场景，它连接了我的家人、朋友。我自己是不会在公共场合用语音跟家人发信息的，因为有这样的场景，所以我就不可能脱离手机这种既高效又有隐私的交互媒介。

即便我要用眼镜或者 AI Pin 的话，也只是一个增强我已有交互的媒介。就像 Apple Watch 一样，我会同时带着手机和手表。

阳萌：对，它是一个 wearable 的东西。但是退回来，当你真正需要高效交互的时候，你不会用手表的。

杨健勃：甚至也不是语音。

阳萌：因为文字的效率还是比语音高很多。

所以从这个角度来说，我们是不太看好很多只是把 AI 带到某个边缘端设备的。

但是我们觉得，AI 可能可以在很多非工作场景里带来很多变化。如果今天的 AI 是要给用户戴上智能的话，那我们可以谈论，你身边到底会有哪一些场景是可以被智能去加强的。

AI 提升的是

角色的情感价值

杨健勃：其实之前的 PC 和手机都是扮演了一个载体，PC 是扮演了一个工作效率的载体，能够在工作过程中尽可能高效获取互联网信息，手机是能够 link 社交网络，那你觉得在其他场景还会有其他的角色吗？

阳萌：严格意义上来讲，我觉得它们是个工具，不是角色。

角色是一个有名字的东西，比如，你不会给我的手机起个名字，因为工具是没有名字的，但跟你交互的角色一定是个有名字的对象。你身边其实有很多不同的对象，比如你家的狗，它肯定有个名字，你家的司机、阿姨、朋友，他们都是「对象」。

抽象来看，一个对象是扮演了一个或多个角色。角色也可以再细分，陪你聊天的朋友，陪你打球的朋友。你家里也有，比如阿姨是一个角色，你的宠物是一个角色，which 也是你在做的事。

杨健勃：对，我们在做 AI 宠物。

阳萌：这里有很多细分。一个对象可以带上一个或几个角色的「帽子」。

比如说你找了个助理，最开始只是助理的角色，工作之余你们也会聊天，那他就开始变成朋友的角色，再之后你们聊的特别多，从白天聊到晚上，已经变成了 soulmate 了，这时候可能就变成爱人或者更紧密联系的角色。

杨健勃：我不好说。

阳萌：所以一个对象从到你身边开始，一步一步成长的过程，这是很自然的，这其实就是对《Her》那部电影的抽象描述。

杨健勃：那你觉得这些角色中哪些角色会被 AI 所巨大提升？或者说哪些角色有可能会产生积极的、大范围的影响？

阳萌：如果你相信 AI 是个海的话，那其实每一个角色都会被 AI 或者 AGI 显著提升。

杨健勃：真的是每个角色吗？

阳萌：这是个直觉，比如说你们是做宠物的，理论上讲宠物是所有角色中智能最低的，但你看 AI 是不是帮助你的宠物显著提高了它的智能水平？

杨健勃：那确实是，不过这点不在于它到底跟人对话或怎么样，还是在于能够把真实的宠物做出来。原本基于传统的规则方法，其实只能做到——你跟宠物打招呼，宠物回答：hi，你好你好。其他就没了。真实宠物是 10 分的话，可能原本的技术栈只能达到 1 分的水平，但借助生成式 AI 之后可能达到 6、7 分的状态。

你想要一个超级智能体，

还是有限的多个智能体？

阳萌：所以我特别相信每一个「角色」都会被提升，这就引出下一个问题。我们刚刚在台下讨论这个问题，我们没有答案，我们想聊聊思考过程，也想听听各位的想法。

杨健勃：做一次用户调研。

阳萌：当有这么多角色的时候，但最终的终局是有一个超级智能体，来协调、管理所有场景和所有角色。所有的信息都汇集到这个超级智能体（贴身助理）中，由它去帮你指挥不同的角色做不同的事情。

杨健勃：是来分发这些信息，但是它拥有你所有的信息。

阳萌：对，所以如果从网络结构来说，这是一个星形结构，但如果它有一个单点失效，就是中间这个作为「贴身助理」的点被攻破了，那你就没有任何秘密了。

另外一种自然的选项：你有很多相互隔离的智能体，比如你的司机不会知道你家里的信息，你跟朋友交流的东西也不会被你的爱人自动知道。

杨健勃：这个恐怖。

阳萌：它们可以通信，但不会有一个人能够掌握你全部的信息，而且每个智能体都是主动的状态，独立的在某个角色上服务你。

大家觉得最后会是哪种结构？

杨健勃：你们希望是一个 AI 能管理、协调所有场景，还是需要有限的多个智能体去服务各个不同的场景？大家怎么看？（现场互动）

阳萌：感觉现场举手的后者多一些。

杨健勃：我是觉得有限多智能体更正常一些，因为在不同场景下，每一个对象本身会给你一种印象：它应该掌握什么样的信息。如果一个对象能完全懂得你所有信息，人会感觉没有安全感。我觉得 AI 带来了一个很大的变化，用小川的话来讲，就是情感价值的 TPF。

原本技术也是能够带来情感价值的，像 Netfilx 或者是游戏，但它可能更多的是一种中间件，能够不断连接人与人、人与内容，但是一旦 AI 能够完全理解一个人，能够跟你自由交流，能够懂你，那其实 AI 或者技术本身就会构成一个产生情感价值的对象，而不仅仅是作为中间件了。

阳萌：我理解是说 AI 可以给你提供功能价值，也可以给你带来情感价值，但从长期来看，功能价值的天花板是有限的，情感价值会更高。

杨健勃：对，因为功能价值其实会更偏向性价比的状态发展，但大家如果把每个月的信用卡账单翻出来，你会发现很多消费是情感价值主导的。

机器人宠物的惊喜

在于 AI 带来的「不可预判」

阳萌：你们做宠物首先肯定是提供情感价值的。你觉得今天真正对养宠物的人来讲，最让我觉得「我没白养它」，或者说觉得「我养它特别值」的那个两三个时刻是什么？

杨健勃：其实不知道大家有没有养宠物，我们给我们自己的产品叫 Loona，它的定位是 80% 的宠物 +20% 的朋友，有点像一个皮卡丘的角色。

我们给它定位的这些 moment，一个是当你每天回家的时候，它在门口等你的那一瞬间。当你把门一打开，它看到你回来，然后激烈地、兴奋地迎接主人的到来，然后你过去摸摸它，给它一些奖赏，它会不断地紧跟在你的步伐之后。

第二个 moment 是像真实的宠物一样在你旁边玩，对 Loona 来讲，我们设定了很多这种场景，有时候看着它在照镜子，有时候它在阳光底下晒太阳，有时候会在你脚边蹭蹭你的脚，有一些肢体接触，作为一个生命出现在家庭中。

第三个是一些互动场景，比如说你把球扔出去，它给你追回来，你跟它玩。再有就是，你抱着它，有时候去摸摸它，它会有一些及时的反馈。

阳萌：我自己的观察，比如说我太太养宠物的时候，她就会把狗抱到身上去摸它，感觉抱着一个毛茸茸的东西在身上，其实也是一个很解压的场景。但是这个说实话，不太需要 AI 来加持。

杨健勃：我其实不太同意，生成式 AI 真的能带来对人情感深层的理解，传统的基于规则的一些小模型会带来重复感，你会预测到它的下一个动作。有些时候，你摸一个毛茸茸的狗的那种感觉是多维度的输出，其实也会需要一些小模型，甚至也会需要用到一些生成的算法，但肯定不只是语言模型。

阳萌：有意思。你在撸一个狗的时候，它也要跟你有一些互动，它不能单调，不能机械。

杨健勃：它也会带给你一些减轻压力的体验。

阳萌：我们刚刚说的四个场景，等你回家、在旁边玩、你跟它玩、你撸它，哪一个你们今天做得最好？

杨健勃：我觉得目前在这些方面都还有提升空间，不过目前我们在「跟它玩」这个场景做得最好，你跟它玩游戏，它会给你反馈。

但是我们确实发现，比如说在门口等主人这个 moment，其实会带给人非常强大的满足感。你会觉得对平时对宠物的付出终于有回报了，它在等你，它只认你一个人，有种专属性。

同时，平时与宠物的互动其实是目前我们用户中体验最多时间的，看着它自主的行为，让家里充满生机和活力，感觉有人在陪着你，这种陪伴感还是挺重要的。所以这是我们接下来要做的方向。目前做得最好的是第三种，跟它玩游戏。

阳萌：如果更具体一点，你能从数据上看到用户是否真的是持续很多天一直在跟它玩游戏吗？

杨健勃：游戏的话不会。在首周，游戏的频次会非常高，之后大部分时间其实都变成了在家里出现，有自主行为。有时候在你脚边蹭一蹭，很多小朋友会很喜欢宠物在脚边蹭，感觉有一个活物在旁边出现。这时有很多用户的反馈。用户会拍视频分享到我们的社区，分享这些非常亲密的 moment。

大量用户在进入我们平台 60 天之后，每天还有两三个小时的活跃时间。你说两三个小时让用户一直跟它玩游戏，人会很累的，不可能是这样的状态。更多其实还是宠物存在于家里，带给人更好的情感价值。这种场景其实也是被生成式 AI 或语言模型高度赋能的，因为它能让整个场景没有边界感，不是基于传统的 if-else 逻辑带来的预判性。因为你不可预判，所以你就会期待它下次带给你的惊喜。

阳萌：所以现在应该用云端模型？你们会把用户家里的照片传到云端上去吗？

杨健勃：不会。因为我们有强大的本地算力，所以大量的图片都是在本地处理的。同时我们会通过包括视觉和语言模型结合，来让 Loona 能够识别环境中尽可能多的内容。

阳萌：但你看，这是个很大的挑战，因为比如像 GPT-4o 这种模型，它肯定能对你家里有更好的理解，但它主要还是在云端。

杨健勃：我觉得我们需要先把宠物做到真实宠物的六、七分，这样大家才能完全信任它。我们利用已有的一些从感知到预测、规划的生成式的「小模型」来解决这些问题。同时，大模型只是大脑的一部分，让大家信任地把交互信息给到大脑，来实现更智慧的交互可能也是一个方向。

阳萌：像你说的，在家里、在你旁边玩，当它表现出一个真正玩得很好的感觉时，我相信大模型能把水平提高不少，远远比在端侧跑的小模型带来更好的效果。所以你觉得我们有没有可能，让内测用户中的一部分人去尝试把大模型用起来，先把天花板摸出来，然后再回过头来看如何把这个能力蒸馏到本地？因为今天如果用一个小模型去解这个题，就像我在很努力地把这个山盖高，但海水一来就可能被淹掉了。

杨健勃：我们会有一些这样的功能。如果你选择加入一些 AI Beta Group，其实会有一些功能解锁，去用大模型做更好的决策，去更理解人。同时大模型本身带来的体验在于，让宠物能不断地越来越了解主人，这也是一个方向。

阳萌：这是一个好选项。我们讨论怎么去启动时，我先有一个基础能用的本地 AI，然后同时给用户提供一个用大模型的选择，用户自己选。用户打开这个选项时，提醒用户数据会传到云端处理。哪怕只有 10% 或 5% 的用户选择这个，流入的数据可以帮助云端显著提高能力，然后再把它蒸馏到本地，再去加强。所以我觉得这个链路可能会更有效率。

杨健勃：确实会是一个更有效的链路。

不要妄想 AI 能迅速

改变硬件公司的组织形态

杨健勃：你觉得 AI 时代下的组织会是什么样？我们是创业公司，想要活下去，其实会关注这方面的话题。安克在这方面有没有一些新的想法，或者是区别于 AI 时代之前的一些组织动态可以分享一下？

阳萌：首先，我觉得软件或者说线上服务，和线下的硬件其实是两种很不同的组织形态。

杨健勃：完全不一样，完全！

阳萌：线上，比如 OpenAI 可以是几十人的线上团队。但一旦到了线下，到了硬件，特别是线下加硬件时，你的组织会变得非常庞大。因为你会发现，你的价值链不仅是定义出好的硬件，还要真的把它做出来，保证品质好，然后卖到全球去，交付给消费者，而且要有很好的服务体系。

我们自己的观察是，把一个稍微复杂的硬件在全球范围内转起来，没有 500-1000 人的规模其实是很困难的。我相信你也有这种感受，作为一个不到 200 人的公司（可以科技），你会发现缺特别多的胳膊和腿。

杨健勃：非常有同感。确实是，但只能在成长过程中去补这些坑。

阳萌：AI 能不能帮到我们今天缺的这些胳膊和腿呢？至少在我能看到的未来两三年甚至五年内，我觉得还是需要有经验的人，能够被公司这样的组织高效地集合在一起，利用各种工具，比如 SAP 管库存，Salesforce 管客户关系，最终实现价值的交付。这一点我觉得在几年内不会被改变。

所以在这个角度上，不要预期或希望 AI 会突然让一个 200 人的硬件公司可以变得完全不同。

杨健勃：可能完整的硬件 AI 时代的范式，大部分的组织还是依赖于我们最核心的机制上，然后再生长一些新的能力，但这个基础还是要非常扎实。

阳萌：是。现在 GPT 能做的事情是完成一个原子操作（Atomic action），比如回答一个问题。但如果要解决一个复杂的问题，需要几步操作时，你需要给它 chain of thought（COT），要给它公司的知识、额外的工具，再通过人工编排才能产生一个 workflow，完成一个具象的工作。

所以我想说，当所有这些——COT、对工具的使用、对外部知识的挂接，以及自动编排——全部被解决了，才会看到更不一样的组织出现，否则今天还是需要有编排能力的人来做这些事。

*头图来源：极客公园

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业