我要投稿

谷歌发布Gemini Live：对标GPT-4o，让每一个人都有贾维斯

发布日期：2024-08-14 08:54:07 浏览次数： 2264 作者：AIGC开放社区

谷歌在今天凌晨举办的“Made by Google 2024”大会上，正式发布了智能语音助手Gemini Live。

Gemini Live的功能与OpenAI在5月推出的GPT-4o语音模式类似，支持自然语言提问，能识别图像、视频和语音是一个多模态智能助手。

例如，打开Gemini Live拍摄一幅清明上河图，然后让其讲解这幅画的历史来历。在讲解的过程中，可以任意打断其对话就像朋友聊天一样。

也可以授权Gemini Live访问你的邮箱、地图和通讯录，只需要向它说”今晚8点，帮我约阿乐去有福气酒楼吃饭。”就能帮你自动完成，基本上和钢铁侠的AI助理贾维斯差不多。

虽然OpenAI的GPT-4o语音模式展示的很早，但属于起大早赶了一个晚集至今3个月的时间还在小范围测试，而谷歌直接快刀斩乱麻领先OpenAI发布语音助手，抢占了安卓手机的市场。

所以，不少用户表示这一次谷歌确实领先了OpenAI一步。当产品性能差不多的情况下，谁能领先发布，谁就能抢占先机。

从大语言模型再到语音助手，看来谷歌的Gemini是要和OpenAI的ChatGPT死磕到底了。

也有人认为，Gemini Live的出现，可能会让很多人放弃使用苹果。其实这个不用着急，谷歌已经明确表示了会在iOS系统中发布只是时间问题。

在Gemini Live演示的现场出现了一个小插曲，主持人拍了一个日历，然后向Gemini Live提问“请查看我的日历，看看她今年来旧金山的时，我是否有空？”尴尬的一面出现了，Gemini Live没有任何反应。

连续问了三次，在第三次主持人已经汗流浃背的时候，Gemini Live才开始回答，“我发现她将于2024年11月9日来旧金山。我查看了你的日历，那段时间你没有任何活动。”

现场瞬间爆发出惊喜的尖叫声~

台下的尖叫声确实让人绷不住，属于演艺圈老传统了。

前两次的提问丝毫没有反应，那一刻对于主持人来说，世界仿佛都静止了。

那个尖叫声让我咳嗽的厉害，俺甚至都无法呼吸了~

不过也有人表示，相比于提前录制好的演示demo，即便是失败两次也喜欢这种直接演示的，他的勇气、真诚和敢于冒险精神那是相当值得称赞的。

Gemini Live的使用方法非常简单，长按电源按钮或对着手机直接说“Hey Google”就能开始使用。

Gemini Live除了能理解语音、图片、视频之外，还能生成图片，例如，帮我生成一张用于生日庆祝的图片，并且可以直接放在谷歌生态应用中使用。

谷歌表示，Gemini Live已经与其邮件、云盘、相册、天气等原生应用进行了集成，未来会扩展至Keep、Tasks、Utilities等知名应用，可以帮助人们自动完成更多的日常任务。

END

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-11

一文读懂GPU最强辅助：HBM

2025-04-11

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-10

借助Google Agentspace扩展企业搜索与智能体应用

2025-04-10

实测：阿里云百炼上线「全周期 MCP 服务」，AI 工具一站式托管

2025-04-10

企业IT规划与AI引入的节奏

2025-04-10

谷歌最新AI芯片打平英伟达B200，专为推理模型打造，最高配每秒42500000000000000000次浮点运算

2025-04-08

BrowserTools MCP：让AI驱动的浏览器交互更智能、更强大!

2025-04-08

Dia，目前最好的 AI 浏览器

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

大模型训练及推理【硬件选型指南】及 GPU 通识

2024-05-09

【不看后悔】一文梳理端侧模型和小模型

2024-07-07

华为昇腾910B与英伟达B200性能对比

2024-07-23

一文带你看懂英伟达A100、H100、A800、H800、H20系列

2025-02-12

NVIDIA消费级显卡4060/4090 AI训练能效比较

2024-07-01

私有化部署大模型非常重要环节：国产显卡和英伟达显卡到底该如何选择？

2024-06-23

对比A100和4090：两者的区别以及适用点

2024-06-24

手把手教你免费把AI大模型接入小米音箱，无需任何代码基础，小白级基础详细操作教程！

2024-10-20

小爱音箱大变身：接入 ChatGPT 和豆包，轻松打造专属 AI 语音助手！

2024-06-08

大家都在问

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-11

理想车载大模型为什么不直接用deepseek？

2025-04-03

JetBrains Junie 内测体验，能否挑战 Cursor？

2025-03-30

Tavily MCP Server深度解析：如何用Cline打造智能搜索神器？

2025-03-28

Claude Desktop- AI大模型+MCP Server结合，能够带给你哪些无限可能？

2025-03-26

罗永浩的AI新战场，能否打破“行业冥灯”魔咒？

2025-03-13

Mac Studio 首发实测：10 万块的顶配 Mac，能跑满血版 DeepSeek 吗？

2025-03-12

【一文看懂】什么是端侧算力？

2025-03-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB