支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


最牛的 AI 应用开发者,都在做 AI 浏览器

发布日期:2025-04-03 14:40:27 浏览次数: 1566 作者:极客公园
推荐语

浏览器领域的革命性创新,探索AI技术如何重塑网络浏览体验。

核心内容:
1. 明星公司The Browser Company的AI浏览器转型之路
2. Arc浏览器到Dia浏览器:从传统到AI驱动的跨越
3. Dia浏览器的产品特性与用户体验创新

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家


The Browser Company 是一家明星且特别的公司。

它创办于 2019 年,base 在纽约,累计融资 1.28 亿美元,估值超过 5.5 亿美元。

核心产品 Arc 浏览器,以颠覆性的产品体验吸引了上百万高粘性用户,在硅谷极客们眼中,Arc 是过去五年最酷的浏览器产品,有着远超 Chrome 等传统浏览器的产品设计。

但在 2024 年春天完成了 5000 万美元融资之后,他们悄悄做出了一个决定——将团队重心转向新产品「全新设计的 AI 浏览器」的研发,原产品 Arc 仅保持维护,用户期待的 Arc 2.0 也许再也不会有了。

半年后,新产品 Dia 浏览器官宣。创始人 Josh Miller 说,他们对这个 demo 中的新产品,有数不清的 good idea。

现在, Dia 终于开启了邀请码公测。


01

为 AI 重新设计浏览器

这支产品创新能力很强的团队,一开始就目标明确:从头开始,打造一款原生 AI 浏览器
为了做到这一点,开发团队认为必须「推翻重来」;即使他们倾注数年心血的 Arc 浏览器已经初步形成规模效应。开发团队从未公布过 Arc 浏览器的用户总量,但仅 Windows 版本上线首月就吸引了 20 万用户,iOS 端 App Arc Search 上线之后用时三个月日活跃用户数量就突破了 10 万。
虽然 Arc 浏览器堪称「古典浏览器时代」的最高潮,但它无力对 AI Agent 对浏览器带来的这场革命产生关键影响;开发团队也曾试图在 Arc 浏览器中整合一部分 AI 功能,但仍然无力改变 Arc 浏览器本身并不是为 AI 而生这一事实。
Dia 官网上的一条信息写道:Dia 并非仅仅是在现有浏览器上添加 AI 功能,而是将 AI 作为核心构建理念,旨在打造一个全新的、由 AI 驱动的浏览环境。
开发团队认为,AI 不应该只是一个应用或一个按钮,而应该成为浏览器底层的能力。
Dia 作为从一开始就「深度整合 AI 能力进入浏览器中」的产品,实际体验能带来哪些改变?

02

极简但优雅的产品体验

表面上,Dia 浏览器是一款同时集成了 GPT-4o 与 Gemini Flash 2.0 的多模态 AI 浏览器,支持个性化对话、视频分析与多任务处理,并且免费、无使用限制。
但如果你已经或曾经是 Arc 浏览器的用户,在打开 Dia 的首页,你就能通过 Dia 首页,意识到两款浏览器产品迥然不同的开发逻辑,即从「复杂极客工具」到「极简 AI 入口」的产品逻辑巨大变化。
作为开发团队对「AI 浏览器应该是什么样」的一个实现方式,Dia 在首页的一个角落加入了「Personalize Dia」功能,你可以通过输入包括「你崇拜谁?」「你喜欢怎样的学习方式?」以及「Dia 的回答风格」三个角度,来帮助 Dia 快速理解用户本身,将 AI 快速设定为用户更熟悉的一个形态。
无论是 Steve Jobs 的创新精神,还是《The Atlantic》、《NYT》、《New Yorker》等媒体的视角,用户的选择都将潜移默化地影响 Dia 的知识结构搭建与思考方式,使其在某种程度上成为用户所崇拜对象的「投影」。
在 AI 融入浏览器的浪潮中,Dia 团队并非简单地将 AI 生硬地塞入既有的框架,而是试图从用户与 AI 的交互入手,构想「AI 浏览器」的个性化定制方案。
更进一步,Dia 提供了多达 20 档的「Dia 的回答风格」强度调节。这就像早期的操作系统允许用户调整字体大小和界面主题一样,Dia 让用户能够精细地控制 AI 的表达方式和情感色彩。默认的中间档位提供了一个平衡点,而用户可以根据自己的喜好,微调 Dia 的「个性」。
简单设置好 Dia 的风格后,你能感受到开发团队在「让 AI 能说人话」这件事上,一定下足了功夫。「舒服」是最准确的描述。
对于经常使用浏览器打开众多窗口、处理复杂工作的用户,Dia 浏览器的 @Tabs 中包括网页内容分析、自动推荐提示词等功能,确实能有效帮助用户理清思路、用最简单的方式梳理复杂内容的结构脉络。
在此前开发团队的早期演示中,Dia 还能帮助用户完成更加复杂的任务,例如自动将邮件中的商品添加到亚马逊购物车中 —— 彼时 AI Agent 概念还没有兴起。而在现阶段版本的体验中 Dia 对网页读取的颗粒度非常细致,但同时也更加强调借助 AI 能力,大幅简化用户界面和操作流程,通过设计上的「克制」来获取更加高效的使用体验。
Dia 的预示着未来的 AI 浏览器,将不再是冰冷的工具,而是能够理解用户、贴近用户,甚至在某种程度上成为用户在数字世界中的延伸。
这与 Manus 团队为 AI 单独打造浏览器的思路异曲同工,都指向一个核心目标:让 AI 更好地服务于人类,同时以更自然、更个性化的方式融入我们的数字生活。

03

与 Manus 不同的产品哲学

对于原生 AI 应用来讲,浏览器作为平台让模型能力可以更深入地理解用户的浏览习惯和上下文,从而提供更个性化和高效的服务。快速地将 AI Agent 概念中的产品交付给用户,因此今年的情况,实际已经变成了「优秀的 AI 应用开发者,会打造自己的浏览器」。
即使过去三十年互联网领域已经发生了数次重大的技术变迁,但浏览器仍然是构成当代互联网最前沿用户体验的重要部分。但这也让浏览器市场变得「极端保守」。
或许会有一些极客用户,会为了屏蔽广告等功能去尝鲜一款新浏览器工具,但绝大部分用户并不会为了一点新鲜感,放弃自己原本已经熟悉的体验 —— 这才是让 Chrome 过去十余年一家独大的根本原因。
如果说 Dia 浏览器现阶段哪一点最让人印象深刻,或许仍然是「新鲜感」。但它的新鲜感与充满「极客工具箱」属性的 Arc 又有着明显不同,Dia 浏览器更像是开发团队打造的一片「适合 AI 应用生长的土壤」。
这个思路与此前打造出 Manus AI 的 Monica.im 团队异曲同工:在开发 Manus 的过程中,Monica.im 曾经一度想打造一款 AI 浏览器,但他们很快遇到了一个问题:AI 和人类共用一个浏览器界面,体验极差。
最终 Monica.im 的解决方案是:为 AI 单独打造一款浏览器,让人与 AI 交互,AI 操作浏览器完成执行命令。作为基于浏览器的 Agent 而存在,它需要用户在「想用 AI」 的时候使用。
针对同一个问题,在浏览器交互上有着极强创新能力的 Dia 团队,给出的答案是:在 AI 能够更好地融入浏览器之后,重新设计浏览器的交互逻辑。
虽然 The Browser Company 声称自己「不做 App」,但浏览器本质上仍然是一个巨型 App。除了 Dia 这样的挑战者,包括谷歌、Opera 等在上一个时代掌握浏览器入口的选手,也在主动拥抱 AI Agent 给浏览器带来的转型机会。
在当前 AI 应用发展处于早期,并未提供手机系统级别的生态入场机会的前提下,无论是 The Browser Company 还是 Perplexity 的 Comet,都选择了浏览器作为布局 LLM 深度交互生态的「船票」。
由于浏览器这个形态的产品自承接端侧用户信息以及互联网入口的属性,因此一些硬件/手机 OS 厂商,都又在这个领域尝试突破,落地一部分 AI Agent 的能力,因此这个赛道会迅速变得「百花齐放」,也会是 AI Agent 短期内最让人兴奋的突破口之一。
问题实际上变成了:对于创业公司来讲,AI 浏览器是否已经是现有生态下的 AI App 终点?

04

创业公司和大厂都在做浏览器

回到一个根源的问题,「浏览器」是什么?
它是互联网历史的第一个「入口」。PC 互联网的最初期,以网景、Mosaic 为代表的图形界面浏览器改变了用户访问互联网的方式,微软 IE 浏览器更是因为反垄断案改变了科技竞争格局。
随后,Office、Adobe 等桌面软件一度兴起,占据大量市场份额,但 Web 端依然出现了 G-Suite 和 Canva、Figma、Notion 等新锐产品,随着 SaaS 模式在全球市场的成功,最终网页应用和移动 App 成为了开发者 top 2 的选择。
至少在桌面平台上,浏览器是聚拢价值的金山。用户浏览信息(新闻、博客、流媒体),执行操作(邮件、创作、视频会议),所有这些,在大模型时代,我们称之为 context(上下文)。
这意味着,AI 有极大的发挥空间,以及被 augmented 的机会。
如果你关注过去数月关于 Agentic AI 的讨论,你会发现 browser 浏览器作为产品形态,频繁地被讨论和使用。
Manus 内置了浏览器,Opera 发布 AI 助手 Aria,Perplexity 和 OpenAI 都在做浏览器产品,当然还有 The Browser Company 的新产品 Dia。
一些原本定义并非浏览器的产品,也选择了浏览器的形态。比如豆包,它的桌面端基于 Chromium 开发。另一家大厂也有类似形态的产品——夸克的桌面端。这两家大厂的产品,功能极其全面,且用户量远远领先创业团队的新产品,最重要的,它们都是各自集团 AI to C 的重点发力产品。

豆包希望成为你的默认浏览器
还有 Claude 的桌面端应用,基于 Electron 框架的 PWA 应用——还是 Chromium。(当然 Claude 大概率是个暂时性的产品,他们应该没准备一辈子用这个形态。)

部分 AI 浏览器或基于浏览器的 AI 产品

还有很多厂商在琢磨怎么让 AI 能够更好地「使用浏览器」,比如刚刚完成融资的 browser-use,以及 Amazon 刚刚发布的 Nova Act SDK,这些项目更多在框架层,为开发者提供调取浏览器的服务。
从 AI 接入方式的层面上,AI 浏览器产品大多可以分为三类:
  1. 传统浏览器 + AI,通常以 copilot 的形式存在,最早有 Mircosoft Edge,以及 Chrome 上包括 Monica.im 在内的各种浏览器插件。

  2. 让 AI built-in 浏览器的更底层,有更多权限。比如 Arc Max 能够整理 tab,Opera Aria 能够像 Manus 一样执行操作,Dia 未来能够拥有记忆,知道用户拿浏览器做过什么。豆包和夸克的桌面端产品,看起来「上网」不再是最核心的 feature——就像打电话之于智能手机。OpenAI 和 Perplexity 正在研发的产品,大概率也在这个范畴内。

  3. 打造一款给 AI 用的浏览器。这是 Manus 主要的产品哲学,他们让用户与 AI 交互,AI 去操作跑在虚拟机上的浏览器,是个更加终局的解决方案。

功能性的 roadmap 是明确且共识的:
最开始,AI 处理一个信息单元,读取单个网页,阅读文字,抽取 YouTube 字幕,或者理解用户当前所处的网页环境;
然后,context 延展,AI 能够理解更多的信息,比如其他已经打开的 Tab,甚至能够记住用户过去打开的网页、执行的操作;
最终,AI 必然会代替用户执行操作,比如挑选商品、发送邮件、写文档、做设计,所有用户在浏览器内能做的事,AI 都可以执行。
这是一个非常清晰的,能够颠覆过去浏览器体验的机会。
只是我们还不知道,这个机会属于拿到 5000 万美元融资的 The Browser Company,还是传统巨头 Chrome 和 Edge,又或者,下一个像 Manus 一样的创业新秀会横空出世,将想象中的用户体验变成现实。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询