谷歌重返 AR 眼镜赛道,多模态 AI 助理成为杀手级应用,硬件已进入原型机开发阶段
发布日期:2024-05-22 21:59:08
浏览次数: 1961
来源:深圳湾
眼镜是 AI 的最佳载体,AI 为 AR 眼镜带来杀手级应用
我们将在这里做一件神奇的事情,我们准备了一份惊喜给大家。它设计精妙,又功能齐备…… 不,事实上它可完全不是这样,它可能会有 500 个 Bug。在 12 年前的 Google I/O 2012 大会上,时任谷歌 CEO 的拉里·佩奇、联合创始人谢尔盖·布林,对首次亮相的 Google Glass 做了这样一段开场。△ Google I/O 2012 现场,Google / YouTube
而后,上市不到两年的 Google Glass 即宣布停产。对此,业界已经有太多的分析和评论。而在今年的 Google I/O 大会期间,已卸任谷歌 CEO 职位的布林也向媒体首度承认了对这一划时代产品规划上的重大失误,并将问题根源指向产品推出时间。Google Glass 在 AR 领域的探索领先于时代,不幸的是,我们把产品推出时间安排的一团糟,我现在真希望当时能安排的更好些。我仍然认为 Google Glass 外形非常酷!随着当前 AI 的飞速进展,Google Glass 不是没有复出的可能性。谷歌将希望寄托于新的多模态 AI 助理 Project Astra,在上周 Google I/O 大会开幕演讲的演示环节,一款新谷歌眼镜不经意亮相。Project Astra 是智能眼镜的绝佳拍档,它为智能眼镜带来了「杀手级」应用,两者相组合,就是完美的硬件形态。这一论断与我们在当天的解读长文的观点一致——谷歌新眼镜是 AI 与 AR 最好的硬件载体。换句话说:眼镜是 AI 的最佳载体,AI 为 AR 眼镜带来「杀手级」应用。你正在做饭或者做运动时,操作手机是件很尴尬的事情。尽管显得有点老生常谈,但布林在这次公开发言中还是特别强调了与 AI 免提交互的重要性,特别是在双手不方便操作设备的情况下。谷歌现任 CEO 皮查伊也非常认同,不遗余力地在各种场合为新的 AI 助理叫好。当有眼镜这样的产品时,Project Astra 会大放异彩。Project Astra 是一款实时多模态 AI 助理,它将接替 Google Assistant 成为新的融合多模态 AI 能力的新 AI 助手,它代表着谷歌人工智能的未来。谷歌新的 AI 眼镜的原型是伴随着新 AI 助理 Project Astra 的发布而亮相的。演示者问 Astra 提问:你记得在哪儿看到我的眼镜了吗?Astra 告诉她:眼镜在桌子上,红苹果旁边。演示者顺着 Astra 的回答,找到了眼镜。她放下手机,戴上眼镜,一个开启眼镜的提示音出现。接着下一个转场,画面中出现了一个代表 Astra 的小圆点。演示者继续与 Astra 对话,询问白板上的开发流程图如何优化,Astra 很快给出了答案——一边语音播报,一边将播报文字投射在眼前。在随后放出的更多手机 Astra 演示视频中,我们看到了以手机为载体的 Astra 的更多多模态 AI 交互能力,其中很多都具备成为 AI 眼镜应用的可能。在硬件设计上,谷歌 AI 眼镜看起来很轻盈,样子与日常佩戴的光学眼镜差不多,却多了眼睛、耳朵、嘴巴的功能:- 嘴巴:信息经过(手机)中枢处理后,经(眼镜)扬声器播报反馈
它与 Meta 的第二代智能眼镜的设计思路一脉相承,都有麦克风、摄像头。不同之处是,谷歌提前做到了 Meta 没有做到、并准备在下一代产品中集成进来的 AR 显示功能。谷歌已向媒体透露,目前正在开发眼镜原型,以配合 Project Astra 使用。
Google Glass 是谷歌的第一代智能眼镜,是可穿戴智能产品的开端。作为 AR 眼镜的鼻祖,谷歌提出了构建在眼前的「第二块屏幕」概念,为我们描绘出了奇幻的增强现实图景。硬件上,它采用了棱镜 + LCOS 光学显示方案,但受限于体积尺寸,仅有 12°~15° 的视场角。眼镜前方设置有一枚 500 万像素摄像头,可拍摄照片、视频。麦克风用于拾取语音,扬声器可以播放声音,完成语音交互闭环。内置加速度计、陀螺仪等传感器,并支持触摸操控,可谓是麻雀虽小、五脏俱全。十年后再回看这款硬件,发现除了元器件规格变化外,其他几乎没有本质的变化。功能应用上,Google Glass 可以拍照片、拍视频、发信息、查天气、导航——而今天的智能眼镜功能也不外乎这些,缺少杀手级应用成为所有 AR 眼镜面临的共同问题。定价 1500 美元,加上卡顿、发烫、像素差、语音识别不准确等问题,以及消费级和企业级摇摆不定的市场探索,终于让 Google Glass 从现象级产品走向了停产。在 AR 眼镜这条赛道上,谷歌的下沉之路与其他眼镜厂商的上升之路并行着,正当 Rokid、Xreal、雷鸟等厂商在光学显示和语音交互方向上摸索前行时,谷歌又不经意地亮相了第二款 AR 眼镜。它出现在 2022 年的 Google I/O 大会上,主打双向实时翻译。外观设计已经比初代 Google Glass 正常许多,黑色的框架,两侧镜腿较宽部位嵌入了主要元器件。后来的路测则是进一步地强化了翻译和导航功能,但这款眼镜最终未能投产。除了 AR 眼镜之外,Google 内部还在研发与 Vision Pro 对标的 MR 头戴设备,名为 Project Iris 的项目,不外乎一体机的头盔造型,加上 Android 系统和应用生态,以及语音和触控交互等。谷歌 AI 眼镜原型是最接近人们期望值的一款智能眼镜。既有麦克风、扬声器、摄像头等传感装置,又有 AR 显示能力,还有大模型 AI 能力。它也是可以为谷歌带来新硬件希望的产品,结合谷歌新人工智能 Astra 将为我们带来诸多应用可能。但鉴于 Ai Pin 和 Rabbit R1 的前车之鉴,谷歌 AI 眼镜的问题也是显而易见的。它响应速度是不是很快?会不会经常出错?用久了也是会发热吗?还有隐私问题,显示精度问题,本地处理能力问题,等等,这些,都找到最优解决方案了吗?这些业界没有功课的难题,谷歌未必能给出最佳答案。但它为我们展示的智能眼镜的图景,仍是诱人的,值得期待的。
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业