AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


截胡OpenAI,抢先苹果发布AI手机,谷歌让我们看到了超级人工智能助理的雏形!
发布日期:2024-08-15 06:39:31 浏览次数: 1709 来源:硅基进化论


今天凌晨,谷歌在硅谷山景城总部举办了「Made by Google 2024」发布会。

会上谷歌宣布推出语音模式Gemini Live,直接对标OpenAI ChatGPT voice!并立即向Gemini高级订阅用户开放,目前只支持英语,未来几周将推出IOS APP并支持多语言!


除此之外,谷歌新发布的Pixel系列手机Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL,也出现了Gemini Live的身影。



这场本该按惯例发生在10月的年度活动,据说是为了避开苹果9月推出新iPhone,所以特意挪至夏天提前发布了!

谷歌之前吃了几次亏,这次趁OpenAI现在危机重重,三天两头的放鸽子,打他一个出其不意,顺便赶在苹果前面,狠狠的秀了一把肌肉!

这次Gemini Live的全新升级,深入地集成了安卓系统、应用程序和Pixel硬件,你真的能感觉到Her快来了!


下面这些场景,谷歌现在都能实现了:


只需长按安卓手机的电源键或说出Hey Google,即可唤醒Gemini助手,通过选择“询问此屏幕”功能,就能获得关于屏幕上显示内容的帮助;

当对着美食探店vlog流口水时,直接指示Gemini“创建一个视频中博主吃的食物清单”,它就会连接到博主视频,从字幕中抓取出需要的信息,下次你也能照原样打卡了;

假设你 正在YouTube上浏览旅行视频,为即将到来的国外之旅做准备。在观看完一段旅游Vlog后,可以点击“询问此视频”,让Gemini列出视频中提及的所有餐馆,并将它们添加至谷歌地图收藏中,方便实地探访;

碰巧看到了Sabrina Carpenter的演唱会海报,只需用Gemini拍摄一张照片,并询问“我是否有空参加她在旧金山的这场演出”。Gemini将从图片中读取关键信息,并与日历进行比对,从而告诉你是否能在那一天到场观看。


之所以有这么丝滑的体验,是因为Gemini为安卓构建了深度集成,这样,AI能做的就不仅仅是读取屏幕内容,还能与我们已经在使用的许多应用进行交互。


作为正面硬刚GPT-4o的语音选手,用户和Gemini Live对话互动非常自然。从陪伴模拟面试、练习口语、头脑风暴到任何沟通需求,Gemini Live都能提供真人般的聊天体验。


你可以在对话过程中随时暂停、打断或改变主题,并且能在10种不同性别和个性的语音中根据喜好选择。


很快,一个既能给你提供情绪价值,又超级全能的超级AI小秘书将来到我们每一个人身边!


借助Gemini大模型, Pixel设备功能也迎来了一大波升级!


提升最大的无疑是 Pixel手机的拍照和视频方面,借助AI能力,有了惊人的飞跃!


Add Me让不在现场的人,也可以很轻松的P到合照上;


Magic Editor利用生成式AI技术,用户可以在魔法编辑器里重新构想和编辑照片。比如扩大画幅、移动物体、更改背景,甚至新增物体;


Guided Frame通过语音指导帮助用户拍摄出色的照片和自拍,不会拍照的男同胞的福音!


实时转录双屏模式:针对可折叠手机推出的双屏模式,用户将手机置于桌面上,多人同时查看对话的实时转录。这对于会议或多人聚餐时的对话非常有帮助。


实时字幕翻译:新增韩语、中文等七种语言翻译,即使在没有网络连接的情况下也可以使用,以后恐怕不需要字幕组了!


此外,还新增集成了文生图、文生视频和文生音频等一系列AI创作功能的工具集Pixel Studio,用户可以通过文本描述来生成创意作品、个人贴纸等功能。


在通话应用中,新的“通话记录”功能会在挂断电话后立即发送私人通话摘要和完整的通话记录,让你不会错过任何重要信息。Clear Calling 功能可进一步提高音频质量,让你的通话更加清晰。


未来,谷歌还有两个个项目将要问世:


一个是Project Astra,允许通过摄像头展现周围环境与Gemini互动,它将会首先在Gemini Live中落地,能做到的事情将超过我们的想象!


另一个是Gemini Research,可以帮助人们实现高级推理、规划和记忆,通过创建多步骤研究计划、整合复杂信息,自动生成研究报告等,将大大提高研究效率,节省时间和精力。


马上,一个个全能超级AI助手将来到我们身边,科幻片中的场景将很快变成现实!你对此怎么看,欢迎在评论区留言。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询