微信扫码
与创始人交个朋友
我要投稿
继 OpenAI 发布会,间隔一天,也迎来了 Google I/O 大会。
我们先来看看之前引发大家剧烈讨论的传闻:
>>> 据传闻 iPhone 原打算接入 Google Gemini 大模型,却给 OpenAI 半路截胡
>>> 与 GPT-4o 不同的是,谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为“Pixie”的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如购买地点或提供使用说明等操作。
>>> Android 15 发布,将展示即将推出的 Android 15 移动操作系统的功能、通过 Android Auto 实现的更多车内集成以及智能手表软件 Wear OS等。
这次大会除了暖场的DJ(救命,完全看不懂啊,赛博DJ),还有哪些精彩细节呢?一起来看看吧
BTW,如果你认真看了全直播,我建议下次来我们机智流看(哭死,看了OpenAI,完全看不下来这个)
Gemini pro 介绍
布局与局势
Gemini 的系列应用
01
—
Gemini pro 介绍
(纯纯炒冷饭,超长上下文+多模态,纯回顾,直接上图吧)
两百万 tokens 上下文
02
—
布局与局势
在硬件方面,第五代 TPU 是 Google 训练 Gemini 的基础,包括 Anthropic等在内的知名公司也在用 Google 的 TPU 来训练模型。
这次 I/O 大会上 Google 推出了第六代 TPU——Trillium,将在今年晚些时候开放云服务。
除了此前发布的 AlphaFold3,DeepMind 团队还在本次大会面向图像、音频、视频发布了三款模型/工具:Imagen3 [1]、Music AI sandbox [2] 和 Veo [3]
Google 搜索从最早的仅支持文本搜索,到后来的语音输入和图像搜索,已经产生了很大的变化。这次在I/O大会又推出了声称“search anything”的“AI+搜索”(有那么点大象转身的感觉不容易啊)
?你的 Google 何必只是 search,还可以是 research、planning、reasoning......
不知道你是否有过遇到问题却不知道该如何描述问题的经历
Google 的“ask the video”功能似乎希望将问答形式突破文字的桎梏,用有时包含了一切信息的图片、视频变成人机交互的新媒介。
好了好了,今晚的Goole I/O就先到这吧,不干不新,有点小失望,还是回味一下OpenAI吧。
[1] Imagen3: https://deepmind.google/technologies/imagen-3/
[2] Music AI Sandbox: https://www.youtube.com/watch?v=-dPqc7l2zu8
[3] Veo: https://deepmind.google/technologies/veo/
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19