支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Dia,目前最好的 AI 浏览器

发布日期:2025-04-08 09:44:25 浏览次数: 1905 作者:MacTalk
推荐语

新一代AI浏览器Dia,可能是未来浏览器的新方向。

核心内容:
1. Arc浏览器的创新功能和市场局限
2. Dia浏览器的诞生背景和设计理念
3. AI浏览器的优势和挑战,以及Dia的体验评测

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
清明假期前,我拿到了 Arc 团队新作品 Dia 浏览器的邀请码。沉浸式使用了五天之后,我想和你认真聊聊这款 AI 浏览器。我认为它很可能是新一代浏览器的雏形。
我们先从 Arc 浏览器说起。如果你是互联网从业者,多少应该听过 Arc 这款产品。自 2022 年发布以来,Arc 迅速在极客的小圈子内流行,它通过动态标签页管理、网页快速预览、Spaces、分屏等等创新功能赢得了不少拥趸。
但很可惜,Arc 浏览器口碑虽好,却一直无法破圈。
去年 10 月底,Arc 公司创始人 Josh Miller 坦诚地说:“Arc 永远不会成为真正的主流产品。它太复杂,太不同,太难上手了。通过用户访谈和数据分析,我们判断 Arc 终将是一款面向极客用户的工具。”
于是,基于对浏览器市场的判断,他们决定重新基于 AI 构建一个全新的浏览器。这就是 Dia 的诞生背景。
Josh Miller 认为,在产品界面中加入几个 AI 按钮并不是什么革命性的突破,Dia 要让 AI 遍布计算环境之中。那才是新一代产品该有的样子。
如果你留意的话,会发现国内的豆包、夸克等 AI 助手在 PC 端的客户端形态也是一个浏览器。为什么是浏览器,而不是 ChatBot 呢?这是一个非常好的问题。去年五月时,字节跳动副总裁朱骏曾分享过豆包的设计逻辑:
“豆包需要离用户很近,随时伴随用户,嵌入用户的不同使用环境。应该是豆包到用户身边,而不是用户到豆包身边。”
我谈谈我的理解。绝大多数知识工作者的办公场景都集中在 PC 端。如果 AI 助手在 PC 上的形态仍然是 ChatBot,那我觉得这产品很难站住脚。因为目前各个应用都已经在快速融入 AI 能力,用户何必要跳出去,使用一个独立的 ChatBot 呢?
所以,至少在 PC 端,我认为独立的 ChatBot 不会成为主流,它仅仅是一个阶段性的过渡形态。想把 AI 渗透到工作的每个角落中,那毫无疑问,浏览器是最好的切入点。
国内外很多公司都已经看到了这个机会。未来我会一一介绍,记得关注 MacTalk。
目前 Dia 还在内测之中,处于早期阶段。每个获得邀请码的用户,完成注册之后,还能再获得几个邀请码。这种传播策略还挺有趣。
今年 2 月,我曾经尝试把豆包作为默认的浏览器使用,AI 浏览器确实很方便,原生集成了很多 AI 能力,这能够提高信息处理效率。比如,我很喜欢豆包浏览器的会议纪要功能。从浏览器的形态切入,再结合一些操作系统级别的能力,AI 浏览器确实可以做的事情太多了。
但 3 月,我又切换回到 Chrome。两个原因,第一,豆包 AI 浏览器仍旧不稳定,卡顿,占用内存比较大。第二,它的产品设计远没有 Chrome 那样简洁和优雅。就当前我的测试感受来看,Dia 在设计和交互上的体验是超过豆包的,毕竟 Arc 团队在浏览器领域还是有诸多积累。
打开 Dia 浏览器后,映入眼帘的页面一如既往的简单。除了把搜索框换成 ChatBot 的入口外,Dia 的 New Tab 页面和 Chrome 几乎一模一样。Dia 没有再使用 Arc 那样的竖向标签栏,而是采用大众已经接受的横向标签栏。从这样的细节里,能猜测到他们团队在努力降低用户的迁移成本,尽量让 Chrome 的用户能够平滑过渡。
单从这个页面的功能来看,Dia 就是一个浏览器版本的 Perplexity。当然,Dia 也做了很多细微的创新,首先,为了兼顾用户的多元需求,输入框不仅可以问 AI 问题,而且还能直接跳转到搜索引擎用 Google 检索。其次,结合浏览器的特性,用户可以直接把某个标签页添加到上下文中。我截了图,你感受下。
浏览器中,我打开了两个与 Arc 相关的 Tab。提问时,可以把相关的 Tab 作为上下文喂给 AI,这样用起来确实很方便,相当于 Dia 在浏览器实现了一个简易的知识库。我喜欢这个功能。
当然,如果你觉得鼠标操作起来比较麻烦,那 Dia 还设计了“@”的交互,类似微信的输入框,只要输入@,就可以选择所有的 Tab,或者指定某些 Tab。
为了让 AI 更好的理解用户,Dia 还提供了个性化的配置入口。点击输入框下方的“Personalize Dia” 按钮,会弹出来一个用于配置的窗口。用户可以输入自己崇拜谁、喜欢什么样的互动方式,以及其他个性化要求,而后 Dia 会尽可能按照用户想要的样子运行。比如,我不喜欢 AI 用列表方式的输出结果,就可以在这里指定。
和其他的 AI 浏览器类似,打开某个网页后,Dia 还可以方便地调出 AI 进行互动,比如总结文章的重点,解释某一句话的意思等等。这部分功能已经变得稀松平常,不再赘述。有惊喜的是,Dia 在多模态方面的能力。我经常会看 YouTube 的视频,英语不好,所以需要借助翻译,现在通过 Dia,或许消费英文内容的效率会更高。
比如,点开著名播客制作人 Chris Williamson 的播客,可以让它帮我总结视频具体说了什么,或者提取某个时间节点的字幕。测试了下,Dia 应该是针对 YouTube 做过特殊的定制解析,它能够跳过广告,识别到视频内容。我切换到小宇宙的页面,让它总结音频内容,它显然拿不到具体的音频,只能根据网页信息做一个简单的概览。
另外,交互上,Dia 还有一个我很喜欢的功能,叫:Add Split View Pane(在 View 菜单下可以找到)。简单来说,它可以在浏览器内快速实现分屏的功能。如下图,我点开一个 Youtube 的网页后,还可以在同一个浏览器窗口中,点开另外的页面。这对于我这样经常需要浏览很多信息的用户而言,是个不错的功能。
想关掉 Split View Pane 中的某一个网页的话,直接在 Tab 那里操作就可以。这个交互真心做到了极致简单,不像很多产品那样看起来臃肿,堆叠按钮。我想这也是为什么之前大家那么喜欢 Arc 浏览器的原因。他们团队这些年来,确实在交互上能够做出令人耳目一新的特性。
除了这些,我觉得 Dia 还有一个重磅特性,叫智能光标。按照之前 Josh Miller 的解释,智能光标会在所有需要输入的地方,提供智能的输入建议,续写、扩写或者总结。同样,它的这个交互也很有意思,我看有人评论说 Dia 的智能光标太隐蔽了,用户发现不了。我的观点恰恰相反,这个设计将会是 AI 时代输入框的典范之作,它以润物细无声的方式,把 AI 融入到了输入框之中,并且没有增加任何的新按钮。
我举个场景化的例子。此刻,我正在刷 MacTalk 的小红书,看到一篇关于 YC 创始人的帖子很有启发,想写个评论,但写了几个字之后,卡住了,不知道写什么,想让 AI 帮忙。如果请你来设计此处的交互,你会怎么做?大部分文档类产品目前的做法都是输入一个“/”,然后呼出 AI。
但 Dia 没有这么干。当我把鼠标放到光标处,这时候,Dia 的光标会变粗。紧接着,点击光标,它再弹出具体的 AI 选项。这个设计,无比优雅和丝滑。当我点了“Help me write”后,浏览器会呼出右侧的 AI 对话框。我描述下自己的大概想法,Dia 会阅读整个页面的内容,并给出续写建议。如果觉得合适,直接点击“Insert”即可。
如果你想让 AI 重点参考某段话续写,那也没问题。选中左侧的文字,右侧输入框会自动把它当成 AI 的上下文。细心的话,你还能看到,我选中文字后,智能光标又出现了,点击紫色智能光标,同样可以调出 AI 能力。也就是说,智能光标绝不仅仅局限于输入框之中。
我推测,后面 Dia 肯定会把光标的能力放到操作系统级别,这样非浏览器的应用,比如微信、备忘录、飞书,也都可以使用 Dia 的这个能力了。智能光标,这绝对会是今年最伟大的交互发明之一。
最近三个月,我应该体验了当前市场上可以体验到的所有 AI 浏览器。不瞒你说,整体看下来,我觉得 Dia 是最好的产品。我知道有人认为 Dia 只是一个集成了 AI 的 Chrome,想颠覆 Chrome 哪有那么容易。我不否认这样的说法,自古以来,挑战旧时霸主成功的故事很少很少,多数都以失败收尾。
但同时,我也为 Dia 的很多细微处的创新而开心。我觉得 Chrome 团队可能很难洞察到 Dia 的这些考虑,因为产品的理念决定了它会在什么样的细节,做什么样的打磨。
但不管怎么样,我的感觉越来越强烈。接下来的一年,新一代的浏览器肯定会纷至沓来。我们走着看。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询