AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


5分钟速览 Google I/O
发布日期:2024-05-15 04:17:12 浏览次数: 1894 来源:机智流



继 OpenAI 发布会,间隔一天,也迎来了 Google I/O 大会。

我们先来看看之前引发大家剧烈讨论的传闻:

>>> 据传闻 iPhone 原打算接入 Google Gemini 大模型,却给 OpenAI 半路截胡

>>> 与 GPT-4o 不同的是,谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为“Pixie”的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如购买地点或提供使用说明等操作。

>>> Android 15 发布,将展示即将推出的 Android 15 移动操作系统的功能、通过 Android Auto 实现的更多车内集成以及智能手表软件 Wear OS等。

这次大会除了暖场的DJ救命,完全看不懂啊,赛博DJ,还有哪些精彩细节呢?一起来看看吧

BTW,如果你认真看了全直播,我建议下次来我们机智流(哭死,看了OpenAI,完全看不下来这个)

总体来看,本次大会可以分为一下3个部分:
  1. Gemini pro 介绍

  2. 布局与局势

  3. Gemini 的系列应用





01


Gemini pro 介绍


纯纯炒冷饭,超长上下文+多模态,纯回顾,直接上图吧)

两百万 tokens 上下文


02


布局与局势

第六代 TPU ?

在硬件方面,第五代 TPU 是 Google 训练 Gemini 的基础,包括 Anthropic等在内的知名公司也在用 Google 的 TPU 来训练模型。

这次 I/O 大会上 Google 推出了第六代 TPU——Trillium,将在今年晚些时候开放云服务。 

AI 超级电脑和大饼?

DeepMind 才艺展示?‍♂️

除了此前发布的 AlphaFold3,DeepMind 团队还在本次大会面向图像、音频、视频发布了三款模型/工具:Imagen3 [1]Music AI sandbox [2] 和 Veo [3]



Google 搜索从最早的仅支持文本搜索,到后来的语音输入和图像搜索,已经产生了很大的变化。这次在I/O大会又推出了声称“search anything”的“AI+搜索(有那么点大象转身的感觉不容易啊)


?如果我没有记错的话,Google的口号是“10 in 1”,要用更少的搜索量,满足用户更多的需求,比如路径规划、行程规划、计划制定、食谱制定等


?你的 Google 何必只是 search,还可以是 researchplanningreasoning......



不知道你是否有过遇到问题却不知道该如何描述问题的经历

Google 的“ask the video”功能似乎希望将问答形式突破文字的桎梏,用有时包含了一切信息的图片、视频变成人机交互的新媒介。



好了好了,今晚的Goole I/O就先到这吧,不干不新,有点小失望,还是回味一下OpenAI吧。


[1] Imagen3: https://deepmind.google/technologies/imagen-3/
[2] Music AI Sandbox: https://www.youtube.com/watch?v=-dPqc7l2zu8
[3] Veo: https://deepmind.google/technologies/veo/



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询