微信扫码
添加专属顾问
我要投稿
初创公司Perplexity如何挑战谷歌,探索未来搜索新方向。 核心内容: 1. 放弃传统跟风,押注AI进化,用大模型直接解析网页内容 2. 冷启动验证AI问答模式的用户价值,避开商业数据谈判陷阱 3. 从工具到对话伙伴,提升互动深度,揭示用户真实需求
最近 Perplexity 的联合创始人兼 CEO Aravind Srinivas 在 YC 的访谈中分享了他的创业故事、与 Google 竞争的感受,以及他对未来搜索会变成什么的思考。我们整理和翻译了采访中的部分内容,原视频内容可以点击「阅读原文」链接跳转收听。(注:文中提问者 David Lieb 是 YC 合伙人)
内容摘要
1. 放弃跟风,押注 AI 进化:早期从强化学习转向无监督学习,抓住 GPT 技术爆发窗口,用大模型直接解析网页内容替代传统索引,以“反常识”策略实现搜索体验质变。
2. 冷启动验证:三人团队一个月内搭建首个可演示产品,抓取公开社交数据生成结构化结果,验证“AI 问答+来源引用”模式的用户价值,避开商业数据谈判陷阱。
3. 从工具到对话伙伴:因 AI 误判人物生死意外出圈后,推出追问功能提升互动深度,用户单次提问量翻倍,揭示“参与感>绝对准确”的真实需求。
4. 对抗巨头法则:抓住谷歌受困广告收入、微软缺乏 C 端基因的弱点,坚持纯净问答体验,用开源模型搭建混合系统,保持低成本快速迭代能力。
5. 平衡纯粹体验与商业闭环:从信息查询向交易行动延伸时,需解决“答案→购买”链路难题,通过“AI 调度器”协调多模型协作,让用户无感完成复杂任务。
1) David Lieb:你是如何进入 AI 领域的?
Aravind Srinivas:我一直对 AI 和深度学习非常感兴趣,这也是我从印度来到美国的原因。真正改变我人生轨迹的是在 OpenAI 的实习经历。当时的研究员 Ilya Sutskever 给了我极具启发性的反馈。第一次与他交谈时,我提出了一些自认为很有趣的想法,但他听了五分钟后就说:“这些研究没什么用。”虽然当时感到非常受挫,但我逐渐习惯了这种直接而坦诚的反馈方式,尽管它有时让人感到不适。他接着画了两个圈:一个大圈代表“无监督学习”,其中包含“强化学习”;另一个小圈代表“AGI”。他说:“这就是 AGI,其他的研究都不重要。”那时正是他们在开发 GPT-1,甚至还没命名为 GPT-1。回到伯克利后,我意识到之前的强化学习研究其实是在随波逐流。于是,我向当时的教授反馈了这一想法,并决定专注于无监督学习和生成模型的研究。
后来,在 Google 实习期间,我偶然读到一本叫 In The Plex 的书,书里提到许多曾与我一样读研究生的人,现已成为行业领军人物。这让我对未来充满憧憬,希望能创办一家公司,将深厚的研究与扎实的产品开发相结合。我花了很多时间思考,并与 Ilya Sutskever 讨论过。他提到,能够同时进行人工智能研究与产品开发的领域可能只有两个:搜索和自动驾驶。因为这两个领域会生成大量数据,而这些数据又能反过来优化 AI 模型,形成飞轮效应。随着 AI 技术的进步,产品会变得越来越好,而产品的进步又能进一步推动 AI 的发展。这种良性循环最终会使公司不断成长,直到 AI 能够自动解决之前产品所针对的问题。
2) David Lieb:你放弃在 OpenAI 的好工作去创办自己公司的契机是什么?你是怎么找到合伙人的?
Aravind Srinivas:我看到一篇由前 YC 合伙人 Daniel Gross 撰写的博客,讨论如何打造下一个 Google,以及如何通过优化搜索功能来实现更多可能性。例如,可以在搜索中添加后缀来过滤结果,甚至优化现有的 Google 搜索排名机制。此外,还可以进行更复杂的操作,例如对搜索结果进行分类。他在文章中提到,大型语言模型(LLM)可以自动识别这些后缀。这让我意识到,生成式 AI 或许能够成为一种更高效的搜索引擎构建方式。
DeepMind 曾构建了一个 Android 环境,旨在开发一个通过智能体(agent)控制手机应用的移动应用原型。我对此也非常感兴趣。当时,我与我的联合创始人兼 CTO Dennis 讨论了这些想法。他是我所在实验室的访问学生,我们探讨了如何构建智能体来控制 Android 环境。我们讨论了许多想法,但并未具体涉及任何公司或产品。我们常常会想:“为什么要做这个?Google 肯定会做。”如果你想做一个更好的 Google Docs,Google 迟早也会推出类似功能。对他们来说,这些只是附加功能。而正因为这些并非 Google 等大公司的核心业务,像 Notion 这样的公司才能获得融资并找到发展空间。
我们最终决定做 Perplexity 的原因,实际上是在产品上线后才意识到的,此前我们并未预见到这一结果。或许无知也是一种幸运。在开发 Perplexity 的过程中,我们意识到 AI 生成的内容可能会颠覆传统搜索模式。因为如果人们不再点击链接,广告这一商业模式将失去意义。关于这一点还有许多细节,但这一核心洞察是我们在产品上线后才逐渐明确的。当意识到了这一点,我就感到我们找到了方向。这一洞察为我们接下来的两年发展奠定了基础。
3) David Lieb:可以聊聊你们最初实验的几个版本吗?
Aravind Srinivas:我曾向我们投资人表达过想挑战谷歌的愿景,他们建议我们慢慢来。
作为一家最初以企业用户为目标的初创公司,我们需要获取企业数据。PitchBook 和 CrunchBase 拥有大量商业数据,我尝试了多种方法与他们合作,希望能做一个令投资人信服的演示产品原型。但他们拒绝了我们的合作请求。于是我们转向了 Twitter。当时 Elon Musk 还未成为 CEO,Twitter 允许学术访问。我们利用 Twitter 数据构建了一个数据库,并将其整理成表格。
我们使用 OpenAI 的 Codex 模型来处理这些数据,当时 GPT-3.5 尚未发布。我们编写了模板,模型根据模板提取信息并生成 SQL 查询。此外,我们还设置了回调机制:如果出现错误,系统会自动纠正并继续查询数据库以检索记录。它的效果非常好,通过一个聊天界面实现了对话、查询和图表绘制功能。这是我们开发的第一个真正意义上的产品。尽管只有三个人参与开发,但我们仅用了一个月就完成了这个项目。我们向许多人展示了它,反响非常积极。
究其原因,首先,这类功能以前从未存在过,用户以前无法在 Twitter 上进行类似的搜索。其次,这种功能让用户能够发现许多有趣的信息。它本质上是一种社交搜索,用户可以通过它了解他人关注了谁、喜欢或不喜欢哪些推文、不再关注谁等细节。
4) David Lieb:你们推出 Twitter 搜索功能后,是如何过渡到现在大家所熟知的 Perplexity 的?
Aravind Srinivas:在推出 Twitter 搜索功能后,我们开始尝试将类似的功能扩展到其他数据源。例如,我们尝试在 LinkedIn 上实现类似的功能,允许开发者根据特定条件筛选信息。然而,实现这一目标仍然面临很大的技术挑战。
我曾看到 Paul Graham(YC 联合创始人之一)的一条推文,他指出,解决问题的过程通常始于一个复杂的问题,最终会得到一个相对简单、通用且可规模化的解决方案。这里有两种方法:第一种是为每个领域(domain)建立索引,将数据转化为特定格式(如 SQL),以便 LLM 读取;第二种是保持数据非结构化,依赖 LLM 在推理和查询时完成大部分工作,而不是在索引阶段进行处理。显然,如果未来朝着第二种方式发展,模型会变得越来越智能。这种方式更具通用性,随着模型能力的提升,其优势也会更加显著。
同时,这也为我们提供了挑战 Google 等传统搜索引擎的机会。我们决定尝试构建一个更通用、更灵活的解决方案。实际上,我们仅用一个周末就完成了这个想法的原型开发。当时,John Shulman 的团队发布了 WebGPT,OpenAI 也开发了 TruthBot。用户可以向 TruthBot 提问,它会搜索网络并返回带来源的答案。然而,其效率较低,因为它使用了 175B 参数的 GPT-3 模型,运行速度非常慢。我们尝试了一个简化版的探索方案,其速度要快得多。我们决定只提取搜索 API 返回的前几个链接,并仅使用已缓存的摘要片段。这样,用户无需上下滑动或翻页,也无需点击链接。所有链接都被直接输入到提示中,模型会输出答案,并以学术格式提供带来源的摘要。
5) David Lieb:所以你们其实是在赌模型会变得足够好,最终让所有这些复杂性变得无关紧要?
Aravind Srinivas:是的,可以说是对时机的把握更重要。比如一年前,当 John 和他的团队尝试时,模型的表现非常差。如果那时将赌注放在模型上,结果是完全行不通的。直到模型的指令跟随能力变得更强,这种方法才开始奏效,并且解决了核心的用户体验问题:延迟。
即便如此,我们发布的第一个版本仍然需要约七秒钟的时间,因为那时我们还没有“流式答案”的概念,必须等待整个答案生成后才返回。此外,我们无法控制回答的篇幅长度,导致有时答案会非常冗长。于是,我们不得不通过硬编码提示,来限制回答的篇幅,要求回答简洁,控制在五句话或 80 个单词之内。
6) David Lieb:你们推出 Perplexity 后,是什么时候你意识到“我们做对了点什么”?
Aravind Srinivas:在撰写发布 Perplexity 的推文时,我心里其实很清楚,人们可能会嘲笑它,认为它会出现错误。第一次引起广泛关注的事件,是一位学术界的知名人士搜索自己的名字,结果系统返回了一个使用过去时态的传记。她非常生气,发推文说:“我还活着,怎么会这样?”实际上,这是因为模型将她与另一位同名的已故人物混淆了。这件事引发了广泛关注,也让人们开始思考:尽管系统提供的来源很可靠,但我们能否完全相信它的答案?
这时,我们发现越来越多的人开始搜索自己的名字。类似的现象在所有消费产品中都曾出现过。我曾与 Mike Krieger(Instagram 联合创始人)聊过,他提到,尽管用户可以通过点击头像回到自己的页面,但他们仍然喜欢直接在搜索框中输入自己的用户名。这已经成为一种非常有趣的人性化习惯。于是,许多人开始搜索自己的 Twitter 用户名或社交媒体账户。模型会整合他们在社交媒体上的行为和资料,甚至结合他们小时候的趣事或招聘信息,生成有趣的摘要并分享。正是在这个时候,我感觉到我们所做的事情具有很大的潜力。
但当时我还没有完全确定。后来,我们推出了允许用户提后续问题的功能。这一新功能使用户的互动时间翻了两倍,提问量也呈指数级增长。那时,我开始意识到,这个产品可能真的有前景。我们不应该放弃,甚至也不需要转向企业级市场了。
7) David Lieb:“我们可能有机会和 Google 竞争”这个想法是何时产生的?是怎么发生的?
Aravind Srinivas:说实话,我从未认真考虑过真的与 Google 竞争,因为我知道,Google 很难在其首页上推出类似我们这样的产品。例如,Google 很难判断一个查询是否纯粹是信息性查询。此外,Google 的搜索页面已经非常拥挤,包括答案框、知识面板、广告和社交视图等。Google 和 Perplexity 的差异就像快餐与健康餐的区别,两者的使用体验完全不同,即使是针对信息性查询。
最初,我更担心的反而是微软,因为他们即将发布 Bing Chat。我们当时与投资人接触,比如 NEA,双方几乎就投资意向达成了一致。有一天,我在喝咖啡时听说微软即将发布 Bing Chat,并且一些截图已经泄露出来。原本我们计划进行 30 天的尽职调查,但随着微软的消息传出,投资人将尽职调查时间延长至 45 天。另一位与我达成口头协议的投资人也询问我对微软推出 Bing Chat 的看法。当时我告诉合伙人,微软的进展可能会迫使我们做出调整,甚至可能需要转型或出售公司。但后来,我的投资人不仅没有要求我们改变方向,反而鼓励我们继续前进。这让我感到非常鼓舞。
接着,Google 发布了一篇由 Sundar 署名的文章,宣布推出 Bard(Gemini 的前身),当时仅放出了产品的截图。这让我们意识到,竞争将变得异常激烈。但我们也清楚,微软一直不擅长消费者产品,这种根深蒂固的问题并非一朝一夕能解决。我认为微软没有抓住机会,公司内部将面临诸多问题和挑战。这为其他竞争者留下了巨大的市场空间。
8) David Lieb:你们最近的版本似乎更加垂直化,比如涉及购物等领域。你希望未来几年 Perplexity 会发展成什么样?
Aravind Srinivas:如果你搜索“买哪款毛衣最好”,Perplexity 会为你提供一个高质量的答案。但最终你会去哪里购买?可能还是会去 Google。这其中的商业价值最终归属于谁?Google 在这个过程中赚取广告费,而我们却没有收入。即使我们推出一个 pro 收费版,也可能会有其他公司利用更便宜的模型推出免费版,从而分走我们的收入。
我们的挑战在于:我们希望用户能在 Perplexity 上完成一站式操作,从提问到购买。但很多用户会觉得,如果在查询“贝索斯戴的是什么手表”时,我们在提供答案的同时还附带“购买”按钮,这在我们看来是一站式服务,但在用户眼中,这就是广告。实际上,这并不是广告,但用户会认为我们是因为收了广告商的钱才展示这个结果的。
因此,产品的商业化与早期用户之间存在一定的矛盾:早期用户不喜欢广告,追求纯粹的体验,而大众市场则需要一个能够全面帮助他们解决问题的产品。这种情况出现在许多场景中,例如查看比赛得分、访问网站或获取 API 文档的链接。Perplexity 可能提供更准确的数据,但用户并不关心这些技术细节。你需要构建一个包含小模型、知识图谱、大语言模型流式回答和多步骤推理等技术的系统,但用户并不关心背后的技术实现。AI 应该能够智能地选择使用哪种模型,这就是我们所说的“路由器”或“协调器”。
这将是最具挑战性的部分。谁能成功构建这样的系统并为十亿用户提供服务,提供一个既能理解用户又能帮助他们完成任务的整合体验,谁就能成为下一个 Google。虽然这个目标看起来非常具有挑战性,但我认为 Google 是目前最接近实现这一目标的公司。下一代系统显然是可以实现的,只要坚持十到二十年,最终我们能够解决这些挑战。
9) David Lieb:未来十年,与你们竞争的公司会有哪些?你认为你们的优势在哪儿?
Aravind Srinivas:我们最大的优势在于对服务用户的执着追求和出色的产品品味。这些优势实际上对专业领域的知识有很高的要求。就像你提到的这些公司中,Google 是一家有产品品味的公司,同时也拥有全球分发渠道,但它正面临一些困境。Google 本质上是一家搜索公司,但它也是一家广告公司,搜索业务的核心目的是为广告收入服务。每季度约 2000 亿美元的搜索收入仍然是 Google 的主要收入来源。尽管 YouTube 和云计算也贡献了收入,但它们的利润率远不及搜索业务。
10) David Lieb:股票价格将成为他们的障碍吗?
Aravind Srinivas:没错,华尔街非常关注搜索收入,一旦收入下降,他们往往会做出过激的反应。在一个用户直接与 AI 对话、由 AI 代理执行任务的世界里,搜索收入自然会受到影响。这并不意味着 Google 不会采取行动,他们仍在积极开发 Gemini 和其他新应用。但要将这些技术整合到拥有数十亿用户的核心 Google 服务中,并非易事。
11) David Lieb:你认为必须开发新的商业模式和变现方式才能赢得这场竞争吗?
Aravind Srinivas:未来我们将面临许多新的挑战,例如购物、旅行等领域。你需要决定选择哪些商家?如何处理预订和取消?谁是其中的“中间商”?谁来决定用户预订哪家酒店或购买哪家航空公司的机票?Google 在 PageRank、MapReduce、视觉深度学习和 BERT 变换模型等方面取得了重大进展。但他们也做了许多看似“枯燥”的工作,例如推出 Google Finance、Google Shopping 和 Google Flights 等服务。我认为 Perplexity 比 OpenAI 和 Anthropic 更具优势来解决这些问题,因为除了推理和模型技术,我们还非常注重用户和产品体验,这是我们的核心 DNA。我们非常熟悉这些技术,能够灵活运用开源模型,进行微调、后期训练和评估。我们不会将公司资源全部用于建设数据中心或制造芯片,也不会仅仅为了突破编程纪录或解决最难的数学问题。我们的目标是构建下一代信息交互体验,并坚信这具有巨大的价值。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-06
vllm近期更新的一些trick总结
2025-04-06
Meta Llama 4 全面解析:全新的原生多模态 AI
2025-04-06
字节跳动开源神器Agent TARS,AI自动化时代真来了
2025-04-06
一文读懂开源 Llama 4 模型
2025-04-06
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
2025-04-06
Meta 对 DeepSeek 的回应来了:Llama 4 发布,上下文长达 1000 万,参数超 2 万亿!
2025-04-06
Colab上运行Gemma 3 + Ollama:开发者快速入门指南
2025-04-06
开源LLaMA 4 发布,288B参数巨擘,传统RAG可能原地失业!
2025-01-01
2024-07-25
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-06-12
2024-07-11
2024-08-13
2024-12-26
2025-04-03
2025-04-03
2025-04-03
2025-04-01
2025-03-31
2025-03-25
2025-03-25
2025-03-24