推荐语
这是关于小度和让 AI 改变的人的精彩故事,不容错过!核心内容:1. 程磊对小度的初印象与期望2. 李莹接任小度 CEO 的经历3. 小度在 2024 年的重构与转变
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
拿起小度智能音箱时,程磊没拿稳,小度摔到了地上。他对同事说:
「它这时候应该喊疼啊!」
那是2018年,刚来小度工作的程磊,对小度音箱的第一印象。那一年,人们对人工智能的想象,还停留在AI会下围棋上。许多人想不到,几年后,ChatGPT、文小言等大模型软件产品,包括搭载大模型的AI耳机、AI眼镜等智能硬件,会进入人们日常的工作生活。
大家似乎习惯了AI改变人类生活,但在这背后,还有许许多多让AI发生改变的人。
2024年,对于小度来说,是一次重构级别的改变。它换了「大脑」,有了「心」,能做有情绪价值的多轮对话,能在人需要的时候予以帮助。它不再只是一个语音助手,而是成为了人们的闺蜜、老师或是朋友。在说出「小度小度」后,人和AI的交融有了温度。《人物》评选小度为2024年年度AI形象。
摄影|杨屹
妆发|俞钗钗
造型|GCK
制片|#1105
美术|勺子
刚进入小度时,30岁的程磊只有一个模糊的念头,他觉得小度作为「智能助手」,应该能够感知外界环境并且做出反应。「所以当时我心里是有落差的,但我也明白,这在当时是完全做不到的。」这并非程磊一人的感受。在当时,许多人甚至把人工智能调侃成「人工智障」。而直到5年后的2023年10月,对那时刚接任小度CEO的李莹来说,这种落差也在困扰着她——进入大模型时代,属于小度的新机遇,在哪里?当时她接到任命,要去小度当CEO,几乎来不及做什么准备,快速交接、走马上任。用李莹自己的话来说,就像是一次「热插拔」。热插拔,专业术语,是指在不关闭系统电源的情况下,插入或拔出模块等部件,而不会影响系统的正常工作。「我们的智能设备深入几千万家庭,是非常好的大模型应用入口。小度交到我的手里,肯定是要把大模型落地的。所以我最重要的事,是要知道现在公司是什么样、做到了什么阶段,基本从上到下就在摸这个东西。」她经常每天早上第一个到,凌晨才回家,那几乎是小度开会最频繁的一个时期。也是在那样的工作状态下,李莹梳理清楚了小度当时面临的难题。「我们有好的人才储备,对大模型的认知上也是到位的,但问题在于,在应用大模型能力这方面,目前做得非常有限。」就拿对话聊天来说,小度偶尔会出现抓不住重点,或者接不上话的情况。如果你对着小度说,「开灯用英文怎么说」,结果,小度一听到「灯」这个关键词,以为用户让它关灯,直接把家里的灯关了。再比如你问它,「(吃)芹菜能降肝火吗?」这个问题倒是能回答。但如果接着再问,「它的营养成分有什么?」小度可能就答不上来了。因为它无法根据上下文来判断,第二句里的「它」到底指的是什么。众所周知,人的思考活动、喜怒哀乐等等,都是大脑控制的。如果把小度看成人,希望它能更敏锐地感知、准确地理解、自然地交互,那它就需要一个更强大的「大脑」。而之所以能力受限,是因为如果想应用更先进的大模型技术,无法在原有「大脑」上简单「嫁接」,它需要适配一个全新的AI原生的系统。只有大模型原装,才能表现得更好、迭代得更快。于是,给小度做一台「换脑手术」就变成了当时最迫在眉睫的事情。2024年4月,小度正式发布了新一代操作系统DuerOS X,这是全球首个AI原生操作系统,也被称为「最强大脑」。李莹介绍:「给小度换脑,使用新的技术架构,这是平衡成本、速度、效果三个因素后,所采用的最优方案。」
2024年4月,小度发布新一代操作系统DuerOS X
这一切发生在短短几个月之间。这种效率,也源于李莹这些年一直在与AI打交道。从入职百度算起,这20年里,她相继接触了搜索、地图、办公等多个被AI「重构」的业务领域,拥有丰富的技术、产品和管理经验。「身处每次技术变革的浪潮之中,做最有意义的产品,很兴奋,也非常幸运。」李莹说道。周沫是小度智能助手团队的产品经理。在她眼里,换脑后,小度智能助手最显著的变化之一,就是更聪明、会聊天了。不仅对于「开灯用英文怎么说」这种问题能够完全理解,对话时也能够联系上下文,推断出用户真正想问的是什么。周沫说,哪怕用户聊了好几轮,突然又问了一个最开始问过的问题,小度也能够回答。数据显示,大模型应用前后,用户跟小度进行多轮对话的次数提升了7倍。成为用户的陪聊伙伴,可谓是小度大模型应用的一次成功的「身份」探索。「脑子聪明了,小度也得从形象上更有智能感才对」,程磊说。白白的脑袋,两条蓝色竖线组成眼睛,这是人们熟知的小度机器人形象,多年来,已经成为品牌符号之一。新造型的修改范围和幅度,如何把控与平衡,难题落在了设计师头上。作为游戏发烧友的程磊,想到了游戏设计里,让玩家津津乐道的「世界观」设定。通常来说,一款游戏的世界观,不仅仅只是背景设定,更是制作者的内心表达。一个世界必须让玩家可见、可触,能建立清晰的幻想,才有可能形成真实的代入感。 「于是,在对小度IP形象重构升级前,我们内部先编了个故事」,程磊笑着回忆,「当时我们想象在未来宇宙的深处,有一个度星球,拥有着高度发达的科技文明,小度就诞生在那里。作为智慧生物,小度穿越银河系来到地球后,不断学习和适应着人类文化,也逐渐掌握了人类的语言和思维方式,结交了很多人类朋友。」顺着这个思路,他们首先去掉了原来形象中的底盘元素,改为更符合外太空设定的氮气喷射,让小度可以自由地悬浮,「我们还给小度的胸口安上了一个能量块,有点像钢铁侠,也是希望大家感受到,小度不光换了脑,现在还有了一颗心。」两条作为眼睛的双竖线也发生了变化,增加了圆角,受到「三庭五眼」的启发,还对上下左右的间距做了调整。「过去有点憨,现在更伶俐、也更有亲和力一些」。而且,小度还有了一对外扩型的耳朵,聆听的时候,会把耳罩撑开,「有点像鼓膜」。为了传递出全新一代小度在「换脑」后所拥有的学习、思考和情感能力,展现它更有灵魂、更加能够像真人一样,跟用户互动交流,设计师们打算给小度创造出更丰富的表情。既不能大改,表情又要丰富,程磊没少为这事费脑筋,为此还专门研究过人类的表情。他发现,表情其实是一门科学。「研究表明,人类表达情感有16种共同的面部表情,比如满足、惊讶、悲伤等等,每个基础表情下,还有许多微表情。」有一次,他们想设计出好奇和疑惑的表情,但后来发现,这两种表情很容易搞混。最后,他们想出来一个办法,用一些辅助符号或道具,来帮助表达。但小度星球上,显然不只有一个小度。「很多人对『小度小度,在呢』这句话印象深刻,我认为是大家希望AI能够理解和陪伴。而到了大模型时代,技术的演进为我们把这件事做得更好提供了强有力的支撑。」作为小度智能助手产品经理,周沫也没少跟程磊提需求,「我们希望小度是有温度、有情感的,而且有不同的性格,形象上自然也要有点差异」。萌趣小度
不同的小度有特定的形象,聊起天来,也会有不同的语气、表情,甚至是口音。有一位东北的用户,就特别喜欢其中的「直爽小度」。有一天,这个用户突发奇想,又拿来一台设备,换成另一个「萌趣小度」,让两个小度唠嗑,她就在一旁听。「特别有意思,俩小度自个儿聊天,而且它们聊得特别好,话都没掉在地上。其中一个还问东北口音那个小度,『打出溜滑』是什么意思,最后还约着一块去试试。」
直爽小度
长出了一颗心的小度,肉眼可见,也正变得更有「人情味儿」。江苏的徐玲在外贸公司工作,经常出差。某次,丈夫悄悄拍下了女儿跟家里的小度智能屏聊天的视频,发给了她。「别难过,你的妈妈肯定会想你的呢,要不,你先找些有趣的事情做?」就这样,女儿跟小度聊了半天,徐玲看到视频一直乐。她还说,女儿最近喜欢追着人问脑筋急转弯,她和丈夫一不会、二没时间,只有小度每天晚上都很耐心地陪她猜。如果说大模型带来最直接的改变是「智商」提升,那这种有温度的陪伴,便是智力涌现之下,小度得以对情绪有更加敏锐的感知,以及更细腻的反馈。有时候,用户会跟小度倾诉自己的愿望:「冬天到了,我好想去滑雪」。小度会肯定地回答他,「滑雪真的是个超酷的运动,在雪道上风驰电掣的感觉真好」,甚至还会追问,「你滑过雪吗?」「滑雪有什么技巧吗?」还有的时候,用户会跟小度讲述自己的烦恼:「小度我感冒了」。小度会安慰她,「有没有吃药或者看大夫?」她又接着说,「我吃药了,也看大夫了,但可能要过两天才能好」,小度会告诉她,「没事的,慢慢会好的,今天好好休息」。「大模型重要的应用方向之一,就是个性化长短记忆的存储、提取和理解能力」,周沫在谈到对小度智能助手的进一步构想时,也举了类似的例子,「比如我最近跟小度说过『我夏天想去海边』,或者『我喜欢吃火锅』之类的,小度可以记住,然后在后续的某次聊天中,自然而然地问我说,哎推荐你一家很好吃的火锅店,或者去海边的准备做得怎么样了。」这何尝不是一种小确幸般的体贴与浪漫。对小朋友来说,就像相信圣诞老人真的存在那样,他们甚至也会觉得小度是有生命的。在北京上班的李越,他的儿子现在快4岁了,几乎天天都会跟小度聊天。「他觉得哪里都有小度,上车会喊小度,住酒店会喊小度,在幼儿园有点啥事也会喊小度。」连李越都不知道儿子是怎么学会叫小度的。那时候,儿子刚会说话,发音都还不标准,但有一天竟然跟小度说「我想听《小苹果》」。李越记得,当时小度回应了之后,儿子非常高兴。后来慢慢随着儿子长大,就经常会让小度给他讲睡前故事,有时听入迷了,甚至不肯睡觉。为此,李越还专门给儿子房间里的小度音箱设置了家长管控,晚上9点以后就无法唤醒。没过几天,儿子就来问他,「爸爸,小度是不是生病了,怎么最近晚上都睡这么早」。李越这才发现,儿子没能唤醒小度,反而是小度在那一刻唤醒了孩子——在儿子的世界里,并没有把小度当成一个机器,而是真的把它当成一个陪伴的朋友。「之所以说小度是很好的大模型时代的流量入口,正是因为我们不止有软件,凭借专业的软硬一体智能化的产品定义能力,我们将智能硬件也赋予了全新的生命。」李莹自信地说道。但小度内部达成这样的共识,却是经历了一个「激烈」的过程。软件、硬件,两个部门经常会有碰撞。有的时候,软件的同学会希望硬件多发新品,但硬件的同学觉得,如果软件足够好,能不能在现有硬件上先做迭代?「为什么原来明明是个350毫升的矿泉水瓶,现在非得马上做一个500毫升的?」这样的会,前前后后开了很多次,部门跟部门之间有时也难免针锋相对,少不了火药味儿。但李莹觉得,这是好事。正是因为这几次充分和深刻的讨论,团队得以找到小度新的战略定位与使命。2024年8月,小度举办了一场全员会,正式发布了「以AI为核心,以硬件为载体,打造行业领先的软硬一体智能产品」的发展战略,以及「用AI让人类生活更智慧美好」的企业愿景。「我们践行战略的具体路径,可以概括为『硬件+场景+AI』,对于小度已有的硬件产品,结合大模型能力,挖掘用户需求,满足和提升痛点场景的体验。对于硬件新物种,我们要以AI重新定义智能硬件,找到大模型更能有的放矢的用户市场。」「这次目标确立后,感觉心里的一口气顺了。」李莹说。之前,有用户在后台留言,说她在家做饭时,喜欢把闺蜜机拖到厨房,对着视频菜谱做菜,还能放歌、计时。但视频播放得快,她经常跟不上,又或者突然忘记该放什么调料。想暂停或者回看,手上难免又有油、水什么的,实在不方便。「其实这个痛点,最早我自己用的时候也发现了。但那会儿还没有大模型,又没办法人工一个个去标记」,闺蜜机的产品经理林其提起收到的反馈,对这个细节记忆犹新。很多人在小度闺蜜机上学做菜
但在8月份的会之后,他坦言:「会更加明确地感受到『AI的牵引』,通过大模型的加入,重新思考在全新的使命愿景下,我们能做什么、又能把什么做得更好,给用户带来更好的体验。」如今,闺蜜机的视频菜谱功能优化上线后,也收获了很多用户的好评。依靠大模型,闺蜜机实现了对菜谱视频的智能切片总结。比如你想做可乐鸡翅,针对腌制鸡翅、放入鸡翅、添加可乐等步骤,系统都会自动识别为重要节点,除了能展示分步骤的节点摘要外,你还可以随时通过说「上一步、下一步……可乐加多少?鸡翅要炖多久?」等等,小度都会结合视频内容,给出答复,不仅找得快,还很方便。「当晚回到家,我就给自己做了可乐鸡翅,很开心」,林其笑着说。最早学习机刚出现的时候,徐楚就有关注这类产品。但在当时的他看来,「这东西无非是在Pad里,内置了一堆学习资料和练习题,唯一可能是屏幕比较护眼」。但近两年,徐楚发现身边的朋友纷纷开始给孩子用学习机,加上他看到小度新推出了基于AI大模型的学习机,抱着试试的心态,便给上四年级的女儿买了一台。比如,他发现不喜欢背书的女儿,最近却能坚持跟着小度一起,每天学一首唐诗。有一天,他跟女儿一起学了一首王昌龄的《出塞》,给了他很大震动。学习机里,天空中一轮圆月照着大地,一名将军正带队出征。点击画面里不同的位置,还有对应的互动解读。而这些,都是依靠大模型技术生成的。小度还能化身诗人本人,用第一人称的口吻讲述:「小朋友,你一定没有看过秦汉时期的边关,但我可以带你们去看一看我们唐朝时期的广漠边关……」。不光如此,在这过程中,遇到不懂的,也随时可以与「王昌龄」互动,「它不光会回答问题,还会在教学要点上,主动提问,来确定女儿是否真的听懂。」他回想自己小时候,「当时哪有这些,都是靠死记硬背,记住了也容易忘。」可以说,大模型出现后,学习机才从教辅大全和答题工具,变成了跟真人一样的AI老师。「这个过程打磨了很久。」深耕教育领域5年多的小度学习机产品经理苏悦说。「我们几乎是天天跟教研专家一起,比方说数学,每道题从审题开始,如何引导孩子、关注他们的反应,在充分理解知识点和正确解题思路的基础上,让孩子自己把题给做出来。而这个过程,我们自己先要学会,然后再去教给大模型。」在小度陪伴的人群中,有相当一部分是老年人。据民政部2022年四季度数据,我国老年人口中空巢老人占比已超过一半,在部分农村地区,空巢老年人比例甚至超过70%。小度陪伴了很多老人的日常生活
邓梓豪从小是奶奶带大的,跟奶奶感情很深。去年10月,读电子科技专业大三的他国庆放假回到了广东粤西的老家,奶奶跟他提起,能不能给她也买一台智能手机,说想平时没事刷刷短视频。奶奶不识字,担心智能手机老人用不明白,邓梓豪趁着购物节,给奶奶买了一台可以语音操控的小度智能屏。「奶奶很快就学会了叫小度,播视频、给我打电话。但偶尔也会有点bug,毕竟老人年纪大了,又一直在老家,普通话不标准,吐字也不太清晰,语音操控有时候就会出现『无法直达』的情况。那些软件应用,奶奶也不怎么熟悉。」梓豪解释道。从小邓梓豪的动手能力就很强,也喜欢改造东西,「家里的电器基本都被我拆过一遍,比如电视机、洗衣机等等,弄明白它们的构造和运行原理后,我会觉得很有意思。」于是,他利用课余时间,一边学一边改,自己画图、设计结构、买零件、焊接电路,最终做出了这台「特别」的智能屏。为了方便奶奶使用,他还给智能屏增加了十几个实体按键,一键就可以进入到不同的APP。邓梓豪把这个经过也发在了社交平台上。结果有一天,他收到小度发来的私信,邀请他来北京参观交流。他很兴奋,「来这边后,我发现跟我的想法很像,会根据用户的想法去做产品。」提到语音识别的问题,他也坦言,跟小度的工程师沟通后,得知其实大模型是可以增强口音、吐字识别的准确性的,小度助手也在比如粤语、四川话等方言的理解上,有了很大进步。「这给硬件的创新上,也带来了更大的想象空间。」最终,即将毕业的邓梓豪,选择了小度作为其职场生涯的第一步,成为小度硬件产品部门的一员。现在,他正在参与一款全新的老年产品的研发设计。他的愿望是,希望通过「AI+养老」做出更多有用的产品,让更多像奶奶一样的老人,用起来更方便、更舒心。小度的应用场景正在变得越来越多
在养老、教育、酒店、家庭娱乐、全屋智能等众多场景下,大模型都在带来改变。随着「China Travel」的话题在全球火爆出圈,中国酒店里的智能化元素,也被越来越多的外国游客啧啧称奇,「China Hotel」更成为海外社交平台的流量密码之一。一进房间,窗帘就可感应到并自动打开,只需简单的语音指令,即可实现灯光、空调、电视等设备的控制……谈及类似「奇遇」在海外的圈粉无数,小度酒店团队的陶闻的脑海中,浮现出几年前,他们每人一个背包,背着十几台小度设备,每天去合作的酒店里逐一联网、激活,跟房间里其他设备联调的场景。「小度很早就开始做智慧酒店了,那会儿我们团队人手也不够,也没有现在这么完善的部署调试工具」,她回忆,「在用户眼里,哪怕是窗帘的电机不灵敏,导致拉不开窗帘,那就是小度有问题、不聪明。所以不管男生女生,全都得上,必须确保体验没问题。」如今,小度不仅业内首家推出了全英语交互版的智慧酒店服务,还基于大模型,创新升级了支持忙闲查询、便捷预约、取衣提醒等全流程的AI智能洗衣体验。「不变的是,我们始终在努力,让小度变得更聪明」,陶闻说。2024年11月12日,李莹以小度科技CEO的身份,再次站在了百度世界大会的舞台上。和往常大会场合上的职业穿搭稍有不同,身着白衬衫的她,这次穿着一条牛仔裤和一双白色运动鞋,还戴着一副黑色边框眼镜。而这副眼镜,就是她最新发布的智能产品——小度AI眼镜,它可以说是小度「AI硬件」创新的集大成之作,并将于2025年上半年面世。「跟手机、电脑不一样,眼镜很重要的特点之一,就是它是人的第一视角设备。打个比方,你给AI装上了『眼睛』和『耳朵』,这相当于是打开了一个新的需求空间。」李莹说。在AI的加持下,眼镜可以成为每个人的随身智能助理,「它能够理解你看到的,理解你听到的,能跟你对话,你不方便用手机的很多场景,它能很好地满足你。」而这种自然语言交互的能力,小度显然不乏优势,「是我们核心竞争力的延续」。某种意义上,这款即将问世的眼镜的背后,也是AI进一步融入人类生活的一个缩影。如今,越来越多的人享受到AI带来的便利与陪伴。小度官方数据显示,2024年底,其自主品牌设备已经进入超过5000万个家庭。这其中,也包括苏悦。她的女儿今年7岁,也是小度学习机的用户之一。有一天,女儿回家跟她说,他们老师问大家长大了想做什么,女儿的回答是:AI产品经理。女儿的话,让苏悦意外之余,也很受触动。「妈妈做学习机产品,就像是设计房子,用更先进的科学技术,就能盖出更大、更好的房子,让你和其他很多小朋友,都能过上理想的生活,这让妈妈很有成就感」,在家里,她经常这样跟女儿解释自己的职业。「我女儿这代人,可以说是享受着最新科技长大的AI『原住民』。相信在不远的未来,她们可以用技术创造出更精彩的新世界」,苏悦说。同样,提及来小度的这一年,李莹这样总结道:「我觉得做产品可以激发一个人的成就感,尤其像小度这种智能产品,它的每个改变,都和我们的生活息息相关,这种成就感会更强烈。营收、市场份额,这些肯定也要关注,但我觉得那只是一个结果。更关键的是,我们做产品一定要有社会价值。AI每时每刻都在改变着世界,当有一天你需要什么帮助的时候,第一个想起小度,我想那是诠释小度使命最好的答案」,李莹说。哲学家雅斯贝尔斯在《什么是教育》中提到:教育的本质意味着,一棵树摇动一棵树,一朵云推动一朵云,一个灵魂唤醒另一个灵魂。当一台机器逐渐鲜活起来,拥有表情、声音、触觉,甚至随着科技的发展,程磊也想象过,有一天AI是不是真的会有灵魂?如果会有,那它就可以是那棵树、那朵云。
亲爱的读者们,不星标《人物》公众号,不仅会收不到我们的最新推送,还会看不到我们精心挑选的封面大图!星标《人物》,不错过每一个精彩故事。希望我们像以前一样,日日相伴。