AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


vivo 用 AI 造了一座无所不能的岛 | 硬哲学
发布日期:2024-10-10 12:36:22 浏览次数: 1757 来源:爱范儿


爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。

在谈论 AI 助手时,有两个被用到泛滥,却再恰当不过的比喻——钢铁侠的贾维斯和科幻电影《Her》。
它们不只是一个看起来更聪明的语音助手,而是让我们看到理想中的 AI OS 形态。
贾维斯做的远不止设置闹钟打开应用这样的操作,而是能执行几乎一切需要跨系统、跨设备完成的任务,这必须用 AI 从底层重构系统的交互体验,甚至能识别用户意图来进行操作。
由斯嘉丽·约翰逊配音的「Her」,创造出富有温度和情感的用户体验,反映的是 AI 时代人机交互的情感连接在加强,而这种情感表达往往需要通过声音的细微变化来实现,这是现在很多 AI 所不具备的。
这样的形态并非只靠一个强大的模型或硬件就能实现,而是需要 AI 和系统的深度融合。
在 vivo 最新发布的 OriginOS 5 上,我看到这种尝试有了新的突破。尽管过去这一年 AI 手机已经数不胜数,但这或许是 AI 与手机 OS 整合地更加彻底的一次。
其中一个关键的标志,就是我在体验过程中,大部分时候感知不到 AI 技术的存在,而最好的技术就应该是「透明的」,
AI 时代,系统的流畅需要重新定义
一直以来,用户对于系统流畅的判断基本就是卡不卡,这固然还是很重要的标准。但在 AI 时代,对系统流畅的要求,不只是单纯地追求速度上的「快」。
这一次 OriginOS 5 的 Ledger 储存账本机制对整个内存管理系统进行重构,从底层技术上支持流畅交互的体验。
同时配合 OriginOS 过去一系列首创优化交互的技术,如「不公平调度」、「异构计算」、「虚拟显卡」等来保证系统的流畅。
其中在刷抖音看微信这些高频使用场景中,能比较明显感知到 OriginOS 5 流畅度的提升。
这是由于 OriginOS 5 能够自动根据使用场景分配内存,刷了一个多小时抖音后比起老系统内存占用少了 15%,而微信这个内存大户在数千条未读消息的加载速度也有肉眼可见的提升。
比起使用 app 的流畅, OriginOS 5 更让我惊喜的是一些自然并非直观的体验。「自然」不等于「直观」,而一个自然的用户界面交互,是一定能让人感到符合直觉和愉悦舒适的。
OriginOS 5 大量功能都支持全局唤起,比如我想唤 AI 助手「蓝心小V 」,最常用的是长按电源键,同时也可以用语音、双指长按或长按屏幕底部导航条。
全局唤起的便利在于,基本在每个界面都能找到最符合你使用习惯的最短路径,来完成想要的操作。
而在搜索场景,双指长按屏幕的方式来调出「小 V 圈搜」也更加符合直觉,圈选需要搜索的部分后,会触发蓝心小 V 的意图识别,自动推荐所需要的服务,比如是查询百科资料,还是创建提醒日程。
其实圈选搜索也不是什么新功能,但 OriginOS 5 中有两个优化的细节,一是圈选更加精准,划线、画圈、长按都能选中识别内容,另外就是主动推荐服务。
AI 搜索如今越来越多人用,重要的原因就是可以用自然语言而不是关键词搜索,同时它还能充当助手在提供一个结果之外,也能分析你的需求给出更多帮助。
当类似的交互和系统无缝融合,这才是真正意义的「流畅」。
OriginOS 5 首次被 vivo 称为 AIOS,所谓的 AIOS 本质是要提供一种更自然、舒适的用户体验,要洞察用户真正的需求,简化获取服务的步骤。
人机交互领域的先驱 Bill Buxton 曾在一篇论文中,列出了自然用户界面 NUI 应该遵循的原则,其中有一条:
简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。
在 OriginOS 5 上还有不少细节,能在交互中产生符合「直觉」的愉悦感
比如消息通知、视频小窗和搜索等不同操作的动效切换保持一致,这个设计看似不起眼,可如果你在多个小窗快速切换时,就能体验到让视觉感知保持一致带来的协调感。
我们认为,系统的自然流畅 ,最佳效果是要像水一样流动。
Simplicity is the ultimate sophistication.。简约是终极的复杂——大自然中,水就是这个表现特质最恰当的物质。
水是世界上最柔软的物质,却能穿透世界上最坚硬的磐石。
把水放进杯子,它就变成杯子的形状;
把水放入茶壶,它就变成茶壶的形状;
把水放进瓶子,它就变成瓶子的形状。
水可流淌、嘶鸣、滴落或碰撞,水应势而变。
最自然流畅的系统交互,也就是各种使用场景下,就像水那般,在天为雾露,在地为泉源。
这不仅仅是一种设计美学,也应该是 AI 应用落地的样子。
手机里一座无所不能的岛
年初爱范儿在 ifanRank 提出一个观点,AI 将成为智能手机新的操作系统,而大模型就是智能操作系统的核心。
系统可以理解用户的自然语言,基于本地的数据训练逐渐理解用户的意图,过去应用提供的服务和功能都无缝整合到系统中调用,用户只要说出需求即可。
当整个交互界面本身就是一个超级智能体,我们使用手机的方式也将改变。
在 OriginOS 5 中, 蓝心小 V 也升级成为智能体(Agent),能够像人类那样理解用户意图,提前预判需求,提供一种越用越懂你的用户体验。
智能体是如今人工智能行业在大模型之外一个重要的研究方向,有望带来 AI 领域的巨大进步,比尔·盖茨甚至认为:
Agent (智能体)不仅会改变每个人与计算机交互的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。
OriginOS 5 通过 AI 带来的效率提升,离不开四个字:意图识别,也是这次系统最令人惊喜的更新。
意图识别在 「原子岛」中体现得最为明显,只要我将文本、图片等内容拖放到原子岛上,它就会根据预判的下一步所需要的服务按照优先顺序放在原子岛中。
当我将一个地址拖放上去,最先显示的就是地图导航,直接出发。
当我聊天时收到一个网购平台的口令链接,拖放上去直接打开跳转。
当我在群里收到各种会议的通知,拖放上去就能马上建立日程。
信息流转的效率大大提升,尤其是在我各个应用浏览信息的时候特别实用,看到想分享的部分文字图片直接拖放上去,就能发送给微信好友,也能快速记录到笔记中。
而且将原子岛搭配小 V 圈搜使用,还能打开一个新世界。
比如我在小红书查找一些家装的指南,不仅可以通过拖放到原子岛分享给家人或记录笔记,同时圈选图片还能给出购买的链接。
而在办公场景中,我也能借助原子岛和一些 AI 应用来打造一个更高效的工作流。
当我在参加线上会议时开启「小 V 帮记」开启实时字幕,如果在和国外友人交流,或者看一些外语的直播,也可以充当同传,并总结记录到原子笔记中。
我可以用小V写作功能,根据需求精简或拓写,还能调整语言风格,比如我可以让文字风格改得更适合更正式。
接着我拖放到原子岛发送给不同需要协作的同事,这对于需要经常跟内外部推进项目的场景来说能提升不少效率
类似的使用逻辑在很多应用之间都适用,也可以将最常用的应用服务自定义置顶,这就能根据你的需求来挖掘更多有意思的场景。
目前常用的第三方应用都基本支持原子岛拖放,包括微信、抖音、美团、支付宝、小红书、微博、高德导航等,覆盖了衣食住行的高频应用。
在我这段时间的使用中,原子岛对我拖放后的意图识别准确度颇高。就像一个阿拉丁神灯,里面有个蓝星人帮你实现愿望,甚至不用许愿,就能给你想要的服务。
此外在 AI 方面还有一个更令人期待的彩蛋——小 V 订座助手(PhoneGPT),只要输入订餐的需求,系统就能自动打开大众点评搜索餐厅,并用 AI 打电话代替用户跟商家预订餐厅。
预订成功后,AI 会马上将包含餐厅地址和联系方式的卡片发送给用户,直接点击就能导航到餐厅,也可以保存到日程定时提醒。

小 V 订座助手演示片段

这是智能体工作的理想状态,AI 不仅能学习理解用户的操作意图,还能模拟人类完成功能操作,用户无需在第三方开放的接口前台操作。
前几年 Google 也推出过一个叫 Duplex 的 AI 电话预订服务,能帮你租车、预订电影票和餐厅座位,但并不成熟,后来媒体发现这项服务提供的 AI 预订很多实际还是由人工完成。
但这确实展示了 AI 应用的巨大潜力,随着大模型能力的飙升,像 vivo 这样的探索有了很多落地的可能性。
这种人机交互的全新形态,让用户在「无感」中获得服务,不用在乎应用本身,服务应该随用户需求自动调节 。
这种交互理念的变化,也在 OpenAI 最近上线的 Canvas 有所体现,OpenAI 研究主管 Karina Nguyen 认为:
我心目中的终极 AGI 界面是一张空白画布(Canvas)。
它能够随着人类的偏好不断演变、自我变形,并发明出与人类互动的全新方式,重新定义我们与 AI 技术以及整个互联网的关系。
与很多 AI 不一样的是,OriginOS 5 里的 AI 功能除了「聪明」,还能感受到比较多的「人味」。
当你用语音唤醒蓝心小 V 就能感觉到,系统自带的超拟人音色更加接近人类,没有违和感。同时也还可以选择多种方言,甚至还支持苗语这样只有数百万人使用的少数民族语言。
在「vivo 听说」中同样都可以识别这 7 种方言并转文字,这意味着这个无障碍功能不只是对听障用户有用,普通用户也可以用它来和不同的方言使用者交流。
「vivo 听说」里还有些贴心的细节设计,比如双击文字能放大并反向显示,方便和你对话的人查看,让交流的障碍再少一些。
而最打动我的,是定制音色,只要朗读一段文字系统就能训练出你的音色作为「蓝心小V」的播报声音。
我让太太给我定制她的声音,连她自己也惊讶这个声音太像本人了,这也提高了我用语音和手机交流的意愿。

当 AI 生成技术不断刷新人的感官认知,我们更需要在人机交互中感受到有温度和情感的体验。
Bill Buxton 认为,自然用户界面 NUI 应该能够感知用户的情境,包括位置、姿势、情绪等,并根据这些信息动态调整交互方式,使得界面能够提供更加个性化和相关性的体验。
而 OriginOS 5 的 AI 交互体验,开始接近这样的 NUI,让我们真正开始在手机上拥有自己的贾维斯。
OriginOS 5 的本原设计,「透明」的 AI OS
两千年前,古罗马建筑师维特鲁威在其著作《建筑十书》中提出了建筑的三大原则:坚固(Firmitas)、实用(Utilitas)和美观(Venustas)。
这三项基本原则被视为建筑设计的永恒准则,后来逐渐演绎为持久(Durability)、便利(Convenience)和愉悦(Delight)。
这些原则不仅适用于建筑领域,也对现代产品设计思想产生了深远影响。维特鲁威以「人」为基点的人本思想,其实也是一种「本原设计」理念。
这和 OriginOS 的设计哲学巧合地跨越时空呼应, OriginOS 中的 「Origin」其实并非指起源或原生,而是回到事物本原,包含物理世界本原和人的需求本原。
设计为本原,本原做设计
无论消除冗余的界面和简化操作回归到最直观、最自然的交互方式,还是通过 AI 感知用户所处的环境和状态,读懂他们的基本需求和真实意图,让反馈和服务更加接近物理世界,都是 OriginOS 5 对「本原设计」的呼应。
借鉴维特鲁威的思想,结合实际体验,我们可以将 OriginOS 5 的设计原则总结为:

自然:提供自然流畅的交互体验,降低用户认知负荷。

高效:利用 AI,实现智能适应和情境感知,主动满足用户需求。

愉悦:注重用户的情感和审美需求,打造令人愉悦的交互和视觉体验。
理想的技术应当是「透明」的,让用户感觉不到技术的存在,而是专注于体验本身。
OriginOS 5 的「透明」式交互,是「回归人类需求本原」的一种体现。
人们在物理世界中习惯于直接、即时的反馈,OriginOS 5 将这种体验带入数字世界,让用户感到熟悉和舒适。
这让我想起《纽约时报》专栏作家 John Markoff 在《与机器人共舞》一书中提到的人机交互路线, IA(Intelligent Augmentation,智能增强),他强调 AI 和人类是协作关系,机器应该是人类能力的拓展,而非取代。
用一个更通俗的概念来说,那就是 Copilot,即协助主驾驶员操作飞机的副驾驶,当主驾驶员需要休息或处理其他任务时,副驾驶员就会接管控制权,二者共同负责飞机的安全飞行。
乔布斯曾在 1980 年在将个人电脑比作「大脑的自行车」 (bicycle for the mind),为什么不是汽车、飞机、火箭,而是自行车?
这个说法来自《科学美国人》杂志的一篇文章,作者发现虽然自行车的绝对速度无法和机动的交通工具相比,但如果计算每移动一公里消耗的热量,人类骑自行车的速率却是最高的,甚至比飞机更高。
这个比喻的本质,其实就是无论什么计算设备,都应该以人为核心。以 AI 为核心的智能产品,更应该成为人们「大脑的自行车」
哲学家诺奇克认为,「智慧是对于重要事物的认识,这种认识在此成为一个(睿智的)人的思想和行为的特征。」
今天这个智慧不仅来自碳基生物,也孕育在硅基智能里。我们在 OriginOS 5 看到的不仅是技术的更新,也是对人类需求的深刻洞察和回应。
回归本原,方能洞见未来。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询