手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?
手机 AI 浪潮的 2.0 时代来了。
自去年安卓厂商纷纷接入大模型,推出第一批主打AI 功能的手机之后,手机与 AI 的融合进程就切换到了快车道。上个月,苹果甚至在 AI 功能还未正式推出时,就将它作为 iPhone 16 的主打功能进行宣传,足见竞争形势的激烈。而现在,安卓阵营这边的第二代手机 AI 产品也纷纷蓄势待发。
必须承认,要将 AI 大模型能力融入手机,厂商所面临的问题依然严峻。这里并不完全是模型性能的问题,而更在于产品设计。当下「AI + 手机」产品的自动化、便捷化的程度不足,相关功能渗透率依然不高,远没有「出圈」。
想要打造真正好用的「手机 AI 」,不只是要做出好的 AI 功能,而是要从系统层出发,对系统内整体的交互逻辑进行重构,使它变得更智能。
2024 vivo 开发者大会上,vivo 推出焕新升级的 OriginOS 5。这代新系统不只是 AI 功能更强大、更智慧,系统全局的各项能力也都再次迭代。vivo 的目标,是让 OriginOS 成为 AI 时代最好用的手机系统。
过去一年,大部分手机厂商做AI 功能的思路,都是先围绕「聊天」式的交互展开。以「聊天」为起点很合理,因为「智能语音助手」已经是手机上存在了十年以上的功能,AI 大模型的应用落地也是从 ChatGPT 等「聊天机器人」开始的。问题也正出在这里。对普通用户来说,要完整地组织语言发出一条指令,编写一条prompt,是一个成本很高的行为。智能手机相比 ChatGPT 这种没有任何数据基础的 AI 应用,最大的优势在于,很多数据其实已经在手机上了,不应该再让用户手动输入。但在这个过程中,也有两个问题要解决。一是要将 App 内各种各样的数据转化为 AI 能够理解的格式,其次则是在授权的层面要做出清晰界定,防止隐私泄漏和数据污染的问题。这就是 OriginOS 5 最核心的 AI 功能升级,Jovi 语音助手与「蓝心小 V」深度融合,蓝心小 V 不再是一个单纯的语音助手,而是拥有了更全面的功能。用户现在可以长按导航条唤醒蓝心小 V,唤醒之后,不只是可以语音、文字输入指令,而是可以直接框选当前屏幕上的内容,输入给蓝心小 V,进行搜索等后续处理。
这一设计非常巧妙,因为大部分时候我们想要搜索、处理,就是我们眼前正在看到的内容,通过「圈搜」的方式,最大程度降低了输入的负担,也避免了 App 适配和兼容的问题,可以覆盖手机内一切场景,还保证了隐私的边界。小 V 圈搜的用法覆盖了各种场景。比如看到一篇小红书笔记,可以圈搜图片上人物的相关资料、相关商品;圈出一段聊天记录、机票火车票订单来创建日程;截取一段电子书、文章、工作材料进行翻译、生成一篇备忘笔记……
更重要的是,用户在框选内容之后,依然可以主动输入指令,进行各种不同的处理,而如果这个「视觉识别」的逻辑拓宽到摄像头,用户可以拍摄现实中的任何内容输入给 AI,进一步将蓝心小 V 的可能性拓宽到无限大。这个功能在目前已在 OriginOS 5 里落地,是以「vivo 看见」的形式存在,主要聚焦于视障人群,帮助他们理解周围的环境。借助 AI 大模型的理解、检索、生成能力,这个功能的外沿还有被进一步拓宽的空间。基于同样的「读屏」逻辑,vivo 还对输入法进行了优化,推出了小 V 写作功能。在各种聊天界面、电商评价、朋友圈发布界面,都可以基于当前手机屏上显示的内容,自动生成内容,辅助用户进行文字编写。这一切都并不是模型层面的革命,而是单纯的产品创新。但它带来的体验优化显而易见。想通过 AI 助手 App 实现类似的「智能回复聊天」功能,用户需要在聊天界面截图、裁切,在 AI App 里编写 prompt,得到回应,再将回应的内容复制到聊天框,而现在则只需要点击按钮就可以实现。
除了读屏之外,OriginOS 5 还加强了各种场景下,多模态数据的「自动处理转换」能力。新的小 V 电话助手、小 V 帮记可以将电话、线上会议的音频实时转成文字,显示字幕,并进一步实现「智能生成摘要」、「同声传译」等功能。这个功能的用法已经很成熟,我们今天大部分电话会议都会有录音,以及转写的文字版。但在手机系统内植入这一功能的最大优势在于,它可以将不同协作平台、不同场景下的电话、会议记录集合到一起,更易于管理。大模型AI 是一个覆盖面极为广泛,但也因此很抽象的技术,难以进行具体的功能定义。大部分厂商,都把这个问题化作一个开放的输入框,丢给用户去思考。最终导致了 AI 产品的逻辑并不复杂,就是一个聊天界面,但用户实际依然不知道它有什么用,要怎么用。可以说,OriginOS 5 开启了一次「便捷化」革命,将手机上的数据,送到离 AI 大模型接口更近的地方,方便用户更容易触达。这是 AI 2.0 时代最重要的主题。除便捷化之外,当下所有大模型AI 产品,面临的另一大难题是「记忆」:几乎所有大模型产品,都无法对用户进行深入了解。在和用户对话的过程中,之前内容的权重会被迅速稀释。也就是说,AI 特别「健忘」,很多时候用户要重复输入同一指令,来保证 AI 还记得之前的要求。对手机来说,问题也是类似的。我们进入移动互联网时代已经超过十年了,很多人手机上、云端储存的,是十年跨度的数据,这些数据淤积在手机里,检索起来变得非常困难。这里最典型的场景是相册。很多人相册里都储存了上万张照片,要从中迅速找到一张特定的老照片,变得非常困难。所以过去几年每个手机厂商都在做相册的自然语言检索,依据位置、人物等等标签进行分类……但在相册之外,如何让手机真正成为我们的「人生数据库、回忆录」,依然是一个更大的问题,而这又恰好是大模型 AI 能够发挥作用的一个场景。vivo在 OriginOS 5 的相册里加入了「时光剪影」功能,不只是帮用户迅速找到想要的照片,而是对照片进行二次组织、加工。它可以自动筛选出一段时间里的照片,通过大模型理解这段回忆,进行智能剪辑、配文、配乐,其中还新增了支持生成 AI 人声音乐的功能。这是全行业的大趋势。过去我们在计算机上处理的数据都是「文件」,是以「数据库」的逻辑进行组织的。但在智能手机时代,这些数据是我们自己拍的照片、写的笔记、与他人聊天的记录,是非常具体的经历和回忆,完全可以用一种更贴合人脑思维的方式,以富文本、视频的形式,进行多模态的组织。
在 OriginOS 5上,最能体现这一思路的功能是「小 V 记忆」。功能上,目前小 V 记忆很像一个「日记本」,能够把不同模态的数据整合在一起,以类似手帐的方式呈现出来,其中包括图片、视频、文本、网页……而在「小 V 记忆」的「图谱」功能里,它把用户本机的文件数据全部进行了标签化处理,按照语言逻辑,生成了一张图谱,借此将不同的文件串联在一起。而这些数据,明显有成为 AI 知识库的潜力。就是说,未来用户可能可以利用 AI 助手,来快速挖掘自己手机上的所有文件信息,以及信息之间的关系。而更重要的是,AI 也可以借助这一套私人知识库,建立起对用户的深入、长期理解,来满足个性化的需求。也就是说,未来我们在和 AI 交互的时候,很多具体的需求,不需要在指令里详细说明,AI 就能「心领神会」。在实现输入的便利化,建立起长期记忆和私密知识库之后,手机与 AI 结合的未来,还有巨大的想象空间等待着探索。这次vivo 放出的新功能中的「订座助手」,就能让我们稍微一睹这样的未来。它基于大模型的理解和生成能力,在用户输入用餐需求后,会自动查找餐厅、获取商家联系方式,拨打过去并代替用户与商家进行订座沟通,最后返回结果,临近预约时间,用户会收到提醒,之后可以一键导航到餐厅。听起来可能有点太超前,甚至像科幻小说的情节。但它的确展示出,当 AI 充分利用了手机的各项功能之后,能便捷地实现多么复杂的任务。尽管AI 是 OriginOS 5 最重要的迭代更新方向,但我们应当意识到,AI 只是手段,它背后隐含的更重要的时代背景,是智能手机的「减法革命」。过去十年,智能手机迭代的大方向是做「加法」。屏幕越来越大,储存越来越高,伴随着通信技术和带宽的提升,可以说,智能手机终结了信息匮乏。但现在,越来越多用户面临的问题是信息过载。我们生活中的设备越来越多,App 越来越多,为抢夺用户注意力的过度设计也越来越多。买一张机票有 4 个 App 推送通知,很多内容看完就忘了在哪看过,各种菜单的层级、选项,多到眼花缭乱。即便用了这么多年的智能手机,也常常找不到自己想要的功能在哪。所以,智能手机下一步的发展方向,特别是软件层面的迭代,就是要解决这个问题。OriginOS 5上,另一个很重要的功能更新是「原子岛」。表面上,它的产品逻辑和 iPhone 的「灵动岛」非常相似,后者是为了适应 iPhone 硬件变化推出的功能。但「原子岛」不太一样,它不只是利用屏幕的一块区域显示点什么,更重要的是,它还具备「预测、建议、信息流转」的能力。比如,「原子岛」会基于日程事件、用户习惯,主动提供 AI 服务建议。比如用户复制了一行地址,拖到「原子岛」区域,就能快速跳转到地图;复制图片,就会优先出现「发送到微信」等分享选项。复制航班代码,原子岛就会自动弹出查询航班信息的按钮。过去,智能手机的功能都被封装在 App 里,不同 App 之间缺乏协调机制,导致了信息的重复问题。而「原子岛」、「小 V 建议」的出现,就是要利用更少的 UI 元素,实现更多的功能服务。过程中通过 AI 能力来预判用户的需求,从庞杂的信息中浓缩、总结出重要的部分,帮助用户「消化信息」。这也是 AI 大模型与手机结合的重要意义。智能手机系统上一次类似的革命,是UI 设计从拟物走向扁平化,凸显出信息,降低用户的视觉负担。这一点上 OriginOS 5 依然在持续优化,统一了很多视觉动效,增强了界面之间的空间关系效果,并强调「数字化设计」,增强关键信息的呈现。最后,OriginOS 5 也对最基础的流畅性、续航、网络信号等性能进行了升级优化。通过「Ledger 储存账本」对内存进行底层统一调度,减少了 App 长时间前台使用时,过度占用内存的问题,减轻了 App 负载带来的卡顿。还对动画流畅度、能效续航、抗老化能力分别进行了针对性优化。实际上,无论是基础的流畅性能优化,界面交互上的创新,还是最前沿的大模型AI功能,它们最终都指向了同一个目标,即如何在提供最丰富功能的同时,最大程度减少用户的负担,保持操作系统的高效。这是未来智能手机操作系统「好用」的关键。OriginOS 5 通过一系列的便捷化设计,AI 功能创新,性能优化,已经成为 AI 时代最好用的国产手机 OS 之一。找到正确的方向路径,通过与 AI 能力更深入地结合,OriginOS 的未来也因此变得更值得期待。