支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Dia,一场关于 AI 浏览器未来的预演

发布日期:2025-04-13 19:19:35 浏览次数: 1587 作者:尹锋以为
推荐语

探索AI浏览器革命,领略未来交互新体验。

核心内容:
1. 浏览器发展三十年:从Mosaic到Chrome的缓慢进化
2. Arc到Dia:从极客工具到大众入口的转变
3. AI操作系统的雏形:Dia如何重塑信息获取与思考方式

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

在过去三十年里,浏览器的进化更像是一场缓慢的修修补补。我们从 Mosaic 到 Netscape,再到 Chrome(此刻不想再提 IE),虽然界面更美了,速度更快了,但本质上,它们仍然是围绕“网页文档”的工具。你输入网址或者搜索关键词,点击链接,等待加载,像在图书馆翻书一样,寻找信息的碎片。这种交互方式,至今未被真正颠覆。

直到, Dia 的出现。

这款由 Arc 公司打造的 AI 浏览器,不是 Chrome 的“AI 插件版”,也不是 Arc 的“继承者”,而是一种全新的思维方式:如果 AI 是浏览器的内核,而不是外挂,会发生什么?因此,Arc 公司一开始就目标明确:从头开始,打造一款原生 AI 浏览器 。

从 Arc 到 Dia:从极客工具到大众入口

Arc 是一款为极客而生的浏览器。它的标签管理、分屏、Spaces 等功能令人惊艳,像一件精致的手工艺品,锋利、复杂、令人着迷。但也正因如此,它始终难以破圈。它要求用户具备一定的系统思维和操作习惯,像一把需要说明书的瑞士军刀。Arc 公司创始人 Josh Miller 曾坦言:“太复杂、太不同,只能是一款面向极客的工具。”

Dia 的出现,是一次从“工具”到“入口”的跃迁。它没有延续 Arc 的竖向标签栏,而是回归大众熟悉的横向标签页;首页极简到只有一个输入框,却隐藏着强大的 AI 引擎。这种“克制”不是妥协,而是一种哲学:不是让用户适应工具,而是让工具适应用户。

“入口”不仅是一个 UI 元素,更是一种认知方式的隐喻。Arc 是为“知道自己要什么”的人设计的,而 Dia 是为“还在寻找的人”准备的。

Dia 的输入框,不再是传统意义上的“搜索框”,而是一个通向思考的接口。你可以像过去一样输入关键词查找信息,也可以直接向 AI 提问、请求建议、生成内容。它不再区分“搜索”与“对话”,而是将两者合并为一种更自然的交互方式。你不需要决定“我要搜索”还是“我要聊天”,你只需要表达你的意图,AI 会理解上下文,给出回应。


这个简洁的输入框,提供 Google 搜索和 Chat 两个选项,当接收到用户输入时,默认情况是调用 Google 搜索,延续了 Chrome 用户的使用习惯;但是当用户输入更多内容出现换行时,立刻切换到 Chat 模式,这些细节的雕琢,给人以惊喜。

这背后,是一种对人类认知过程的尊重。信息获取和思考,本质上是连续的,不该被工具割裂。传统浏览器的搜索框,是你与互联网的“入口”;而 Dia 的输入框,是你与 AI 的“接口”。它不只是打开网页的工具,而是你思考和表达的起点。

AI 不再是插件,而是操作系统的一部分

Dia 的真正野心,不是做一个“更聪明的搜索引擎”,而是成为一个“AI 操作系统”的雏形。正如 Josh Miller 所说:“在产品界面中加入几个 AI 按钮并不是什么革命性的突破,Dia 要让 AI 遍布计算环境之中。”它不是在浏览器里加一个 AI,而是让 AI 成为浏览器本身。

甚至在 Dia 的官网,只有一句话。

notion image

  • AI won’t exist as an app. Or a button. It’ll be an entirely new environment — built on top of a web browser.

通过半个月的使用,我认为这句话是 Dia 的基因。

比如它的智能光标

按照 Josh Miller 的解释,智能光标会在所有需要输入的地方,提供智能的输入建议,续写、扩写或者总结。 它的这个交互也很有意思,只需将光标放在输入框,或选中一段文字,智能光标就会出现,悄无声息地变粗、变蓝,点击一下(快捷键 ⌘ + E,也可以点击浏览器右上角的 Chat 按钮),右侧的 AI 面板就会弹出。 我看有人评论说 Dia 的智能光标太隐蔽了,用户发现不了。我的观点恰恰相反,这个设计将会是 AI 时代输入框的典范之作,它以润物细无声的方式,把 AI 融入到了输入框之中。

notion image

举个具体例子,有段文章片段想要AI 润色一下,只需要选中片段,点击一下智能光标,Dia 就会唤出 AI 面板,理解你当前页面的上下文,给出修改建议,甚至直接替你写好,点击 Insert,一键替换。 你有可能有注意到,智能光标绝不仅仅局限于输入框之中。 而这一切,无需插件、无需跳转、无需“/”命令。

再比如 @Tabs 功能。

notion image

只要你输入 ‎@ 符号,就能把任意打开的网页作为上下文喂给 AI。就像你在和一个助手对话时,顺手把几本书递给他:“这些是我刚看过的,你参考一下。”AI 不再是孤立的对话机器人,而是你信息流中的一部分。相比那些动辄需要整理、归类、标注的知识库产品,这种方式轻盈得多,也自然得多,我认为这是普通用户能够快速使用的一种知识库产品。

多模态能力:理解的不只是文字

Dia 不止能读网页,它还能“看”视频、“听”播客。你在 YouTube 上打开一个播客,Dia 可以跳过广告,提取字幕,甚至总结视频内容。我测试了很多个视频,响应非常快,甚至广告才刚开始播放一会,才几秒钟 Dia 就能总结出来,他是怎么做到呢,有了解的朋友可以介绍一下。

notion image

这不是简单的“AI 总结”,而是对多模态内容的理解与重构。它让你不再被动消费信息,而是主动提取价值。

分屏交互:信息的并行处理

Dia 的分屏功能,是一种被低估的基础能力。它允许你在一个窗口中并列打开多个页面,不用在标签页之间来回跳转,也不必依赖记忆去维持上下文。你可以同时查看、编辑、比对不同的信息块,像在一个有序的工作台上处理事务,而不是在一堆散乱的抽屉里翻找。我们的大脑并不是线性处理器,而是一个不断在多个上下文之间切换的系统。分屏的意义在于,它尊重了这种认知方式,让你在面对复杂问题时,拥有更自然的操作路径。

操作上也很简单:Control + Shift + = 添加分屏,Command + W 关闭分屏。记住这两个快捷键,你会发现,切换视角和组织信息变得顺畅许多。

notion image

以上是我在写这篇文章的时候一张 Dia 的截图,左侧是 YouTube 视频《**An early peek at Dia, our second product | A recruiting video》,**中间是我在 Notion 网站中编辑此博客,右侧是 Chat 界面,Dia 让我做到了边看边问,边想边写。

延伸一下,这不仅仅是一张“产品截图”,而是一种“思维状态”的截图。你在浏览、在记录、在提问、在生成内容——而这些动作,不再是割裂的,而是并行的。Dia 的分屏能力、智能光标、上下文感知的 AI 回应机制,她甚至能基于两个网页进行聊天,都在这张图里悄然浮现。它不是在“展示功能”,而是在“展示你如何思考”。

更有意思的是,这张图本身也体现了 Dia 的哲学:不是让你适应工具,而是让工具适应你。你没有被迫跳转页面、切换窗口、复制粘贴,而是像在一个有机的空间里流动。信息、思考、表达、反馈,像水一样自然地汇聚在一起。

个性化设定:AI 也可以“像你一样思考”

Dia 还提供了“Personalize Dia”的入口。

你可以告诉它你崇拜谁、喜欢什么样的表达方式、偏好哪种语气。它会据此调整回答风格,甚至构建出一个与你价值观相近的“人格投影”。AI 不再是冷冰冰的工具,而是一个与你有默契的伙伴。

图像

我设置了这些人:Steve Jobs, Elon Musk,Patrick Collison, Paul Graham, Naval Ravikant, James Clear,Brian Chesky, Jack Dorsey,Naval Ravikant,Richard Feynman,可以参考一下。

    简单设置好 Dia 的风格后,你能感受到 Dia 开发团队在「让 AI 按照自己的意愿说人话」这件事上,一定下足了功夫,很舒服、很优雅。本篇文章绝大部分内容都是 Dia 根据我的设置创作出来的,我自认我没有这么好的文笔和哲思,你们感受下。

    浏览器的未来,不是更快,而是更懂你

    传统浏览器的逻辑是:你找信息,它展示信息。而 Dia 的逻辑是:你表达意图,它完成任务。

    这背后是一个根本性的转变:从“人操作界面”到“人表达意图,AI 执行任务”。这正是 Agent 思维的核心。

    在 Dia 的早期演示中,它已经可以自动浏览亚马逊、添加商品到购物车。未来,它可能会帮你订机票、写邮件、总结会议,甚至成为你数字生活的“第二大脑”。

    写在最后:Dia 是终点,还是起点?

    有人说,Dia 只是一个集成了 AI 的 Chrome。也有人说,它是浏览器的 iPhone 时刻。

    我更愿意把它看作一个问题的起点:如果我们从 AI 出发,重新设计浏览器,会是什么样子?

    Dia 给出了一个答案。它不完美,但它真实。它不是终点,而是一个值得出发的方向。

    在这个信息过载、注意力稀缺的时代,我们不需要更多的工具,而是更少的阻力。Dia 的意义,不在于它能做多少事,而在于它让我们少做一点“无意义的事”

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询