我要投稿

5分钟速览 Google I/O

发布日期：2024-05-15 04:17:12 浏览次数： 2072 作者：机智流

继 OpenAI 发布会，间隔一天，也迎来了 Google I/O 大会。
我们先来看看之前引发大家剧烈讨论的传闻：
>>> 据传闻 iPhone 原打算接入 Google Gemini 大模型，却给 OpenAI 半路截胡
>>> 与 GPT-4o 不同的是，谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为“Pixie”的多模式 Google Assistant 替代品，它可以通过设备的摄像头查看物体，并执行诸如购买地点或提供使用说明等操作。
>>> Android 15 发布，将展示即将推出的 Android 15 移动操作系统的功能、通过 Android Auto 实现的更多车内集成以及智能手表软件 Wear OS等。

这次大会除了暖场的DJ（救命，完全看不懂啊，赛博DJ），还有哪些精彩细节呢？一起来看看吧

BTW，如果你认真看了全直播，我建议下次来我们机智流看（哭死，看了OpenAI，完全看不下来这个）

总体来看，本次大会可以分为一下3个部分：

Gemini pro 介绍
布局与局势
Gemini 的系列应用

—

Gemini pro 介绍

（纯纯炒冷饭，超长上下文+多模态，纯回顾，直接上图吧）

两百万 tokens 上下文

—

布局与局势

第六代 TPU ?

在硬件方面，第五代 TPU 是 Google 训练 Gemini 的基础，包括 Anthropic等在内的知名公司也在用 Google 的 TPU 来训练模型。

这次 I/O 大会上 Google 推出了第六代 TPU——Trillium，将在今年晚些时候开放云服务。

AI 超级电脑和大饼?

DeepMind 才艺展示?‍♂️

除了此前发布的 AlphaFold3，DeepMind 团队还在本次大会面向图像、音频、视频发布了三款模型/工具：Imagen3 [1]、Music AI sandbox [2] 和 Veo [3]

Google 搜索从最早的仅支持文本搜索，到后来的语音输入和图像搜索，已经产生了很大的变化。这次在I/O大会又推出了声称“search anything”的“AI+搜索”（有那么点大象转身的感觉不容易啊）

?如果我没有记错的话，Google的口号是“10 in 1”，要用更少的搜索量，满足用户更多的需求，比如路径规划、行程规划、计划制定、食谱制定等

?你的 Google 何必只是 search，还可以是 research、planning、reasoning......

不知道你是否有过遇到问题却不知道该如何描述问题的经历

Google 的“ask the video”功能似乎希望将问答形式突破文字的桎梏，用有时包含了一切信息的图片、视频变成人机交互的新媒介。

好了好了，今晚的Goole I/O就先到这吧，不干不新，有点小失望，还是回味一下OpenAI吧。

[1] Imagen3: https://deepmind.google/technologies/imagen-3/
[2] Music AI Sandbox: https://www.youtube.com/watch?v=-dPqc7l2zu8
[3] Veo: https://deepmind.google/technologies/veo/