微信扫码
与创始人交个朋友
我要投稿
写在前面
01 什么是AI搜索?
AI搜索是指利用AI技术来增强和改进搜索体验的一种搜索方式。它不再局限于关键词匹配,而是力求深入理解用户查询背后的真正意图,提供更精准、更全面的答案。
以目前最火的AI搜索产品Perplexity为例。Perplexity 巧妙地将大语言模型 (LLM) 与传统搜索 API 结合起来,利用大模型的自然语言交互和信息整合能力,加上传统搜索引擎的强相关结果,很大程度提升了用户的搜索体验,包括总结提炼答案、列出信息来源、支持多轮对话,并在结尾提供相关话题等等。
举个栗子
最近备受关注的美国大选,民主党总统候选人哈里斯于8月6日选了Tim Walz做副总统候选人。我们分别问了ChatGPT、Google与Perplexity,哈里斯为什么做这个选择。
ChatGPT:由于这件事刚发生不久,ChatGPT第一反应说没有这个信息。当提示它去搜索一下,它给出了一个Walz的简单背景介绍。
Google:给出了一些相关新闻的链接
Perplexity:直接给出了一个比较完整的分析,并且注明了信息来源、列出了后续可以继续探索的相关问题。浏览下来,对于哈里斯为何选择Walz有了个不错的理解:
IR->Web Search->AI Search
回看搜索引擎的发展历史,从最初的信息检索(Information Retrieval)到网络搜索(Web Search)再到如今的AI搜索,背后是对用户意图理解及信息探索不断深入的过程。
最早是信息检索(IR),主要面向用户的信息需求。针对用户的查询,系统从语料库中检索匹配的文档。随着互联网的普及,用户的意图变得越来越多样,包括信息检索,导航类查询(访问特定网站)和交易型需求(完成某个动作,如购物、文件下载)。这个期间Google作为搜索引擎横空出世,并且找到了广告变现的商业模式。而随着大模型的出现,其出色的问题理解和信息提取能力,让搜索得到进一步发展。
Google搜索的核心是关键词查询(Keyword Search),用户要找到合适的关键词。如果问的是个相对复杂的问题,用户需要不断尝试不同的关键词,得到搜索结果,再一一研究给出的10 blue links来理解寻找答案。而AI搜索,用户的核心是要探索和明确自己的意图。在得到答案的过程中,用户在对问题不断地探索和研究。搜索结果包括对问题的综合答案,还包括与之相关的问题,来激发进一步思考,从而帮助用户对问题建立更全面的认知。这是为什么Perplexity的Slogan是"知识的起点",也把自己称为“知识发现引擎”。
对此,创始人Aravind Srinivas在与Lex Fridman的访谈中给了很好的回答:
我们雇佣的第一个员工来问健康保险。去Google搜索时,Google没有动力给你明确答案,他们希望你点击所有链接并自己阅读,因为这能带来广告收入。任何比链接利润低的广告单元,或者任何会降低链接点击率的广告单元,都不符合Google的利益,因为这会减少高利润项目的收入——Google的广告收入太惊人,没办法“戒掉”展示链接的广告模式。我们从未尝试在Google擅长的领域与其竞争。如果你只是试图通过构建另一个搜索引擎来挑战Google,并有一些其他的差异化,如隐私或无广告之类,这是不够的。颠覆来自重新思考整个用户界面本身。为什么我们需要链接占据搜索引擎用户界面的显著位置?我们应该反其道而行之。
04 AI搜索有壁垒吗?
做好知识检索和数据闭环可能是护城河
Perplexity第一个把大模型和搜索API巧妙结合,提供了出色的产品体验,抢先获取了大量用户与口碑。然而,产品“套壳”没有技术壁垒的问题也随即显现:在Perplexity的启发下,大量AI搜索产品如雨后春笋般涌现。在开源社区,几百行代码就可以构建一个Perplexity的替代品。复制成本如此之低,那么这类产品彼此竞争的壁垒在哪里?
05 AI搜索机会在哪里?
做过搜索的人都知道,衡量搜索引擎的好坏核心在于长尾搜索( “It is all about tails” )。头部查询每家引擎都可以做得很好;对于长尾搜索,Google依靠其技术实力尤其是海量的用户反馈,把搜索结果的相关性做得非常好。因而,对于实时、长尾、任意领域的搜索,AI搜索需要依赖传统搜索引擎API来完成,在结果上的优势也未必明显——许多长尾领域没有太多结果可供“挖掘、整合、追踪、呈现”。但如果搜索针对有限、相对静态的数据,尤其涉及对复杂问题/研究型问题的搜索,AI搜索就能扬长弊端,发挥出它的优势,提供更好的结果。
从这个角度思考,我们认为,对AI搜索来说,有两个方向是非常适合的——即垂直领域搜索和企业知识管理。与数据量庞大、实时性要求极高的通用搜索不同,垂直领域和企业级搜索领域的数据量相对有限,更新频率较低,恰好规避了AI搜索在基础设施上的劣势。
每个垂直领域都有其独特的语言体系、知识结构及信息需求,通用搜索引擎往往难以满足这些专业化需求。我们认为,AI搜索引擎对此能够提供更好的搜索体验,比如以下的几个方面:
聚焦服务该领域的人群。比如通过社交传播将垂直领域的人聚集在一起,互相启发进行相关问题的持续探索。类似Perplexity Pages目前的功能,用户可以看到其他关注某个话题的人的问题和答案,彼此启发对该话题进行深入的探究。而这些“爱好者”的“探索路径”以及搜索到的回答,又将帮助AI搜索在该领域越做越好——回答得更深入、更准确。
提供更好的数据挖掘和分析。垂直领域的数据蕴藏着巨大价值而很多没有发挥作用。传统的搜索引擎通常只能提供简单的信息检索功能,难以做到对数据的分析和洞察。AI搜索则能够利用AI的分析及整合能力,加上对领域的理解,深度挖掘数据价值给出更好的结果,比如:趋势分析预测(如金融领域股价走势预测)、通过海量数据挖掘做关联分析及知识发现(如医疗领域,发现疾病之间的关联关系、药物的潜在副作用等)、利用多模态能力做可视化数据分析等。
搜索结果个性化。 AI 搜索引擎可以根据用户的搜索历史、兴趣偏好、专业背景、职业特征等信息,对搜索结果进行个性化生成,将最符合用户需求的信息优先展示。
其中一个典型的代表是Consensus。这是一款聚焦在学术及健康领域的AI搜索工具,旨在简化学术研究,类似于“AI版的Google Scholar ”。它能够根据用户提出的具体问题,找到相关的经过同行评审的学术论文。该平台利用了一系列大型语言模型来自动化研究过程中的关键步骤,使其成为研究人员、学生和专业人士的强大工具。Consensus成立于2021年,目前已拥有超过200万注册用户和40万月活跃用户,包括来自斯坦福大学、辉瑞公司和美国国家科学院等知名机构的学者和 AI 研究人员。Consensus 有 1.2 万名付费用户,预计今年有望达到150万美元ARR。它最近刚完成由Union Square Ventures 领投的1100万美元A轮融资。
Consensus提供的核心价值包括:
智能化决策支持。提供数据分析和预测服务,帮助企业优化运营效率、降低决策风险。
信息安全和隐私保护。 AI 搜索引擎可以通过本地化部署、数据加密等方式满足企业的需求。
Glean提供核心价值主要是:
自然语言交互。利用人工智能和自然语言处理技术理解用户的搜索意图,即使是模糊或口语化的查询也能返回精准的结果。
统一信息孤岛。整合企业内部各种应用程序和数据源,例如Slack、Salesforce、Google Workspace 等,为用户提供一站式搜索体验。
个性化搜索结果。根据用户的角色、团队、兴趣及过去的行为,提供量身定制的搜索结果,提高信息的相关性和效率。
2B知识搜索的第三个挑战在于企业数据的接入和整合。AI/Web Search(尤其是借助现有搜索引擎API)只有那几个引擎和数据源,但企业内部的数据源非常复杂多样,还有很多定制系统,中国市场SaaS的渗透率低,就更是发散。这样复杂多样的数据源接入和整合本身就是一个巨大的挑战,很难做一个统一的产品短期对企业的知识进行全面和完整的搜索。
企业知识搜索是未来2B AI应用的基础
以上说的是技术层面的挑战。从成本收益上考虑,与2C领域相比,企业的数据量有限,搭建AI搜索系统的成本和工程难度都相对更低。而且这个成本和企业规模相关,越是大型企业,虽然数据量大,但知识搜索带来的收益也越高,有利于企业打破专业分工和知识的壁垒,更有利于培养跨部门的通才和具备全局视野的管理者和专家。这个潜在收益是大型企业愿意为企业知识搜索系统付费的主要原因之一。
我们认为,企业知识搜索是未来2B应用AI Agent的基础,很可能也是未来AI Worker自学习和融入组织的必经之路。想想人类员工在一家现代企业中工作,文档库和信息系统是其主要的信息来源,也是学习和成长最重要的工具。知识是现代企业运转的基础和媒介,对于AI Worker来说也是一样,如果不能把手头的任务或者问题转化成有效的搜索交互,它是无法在企业组织中完成任务以及融入团队协作的。因此知识搜索几乎是所有企业AI应用的基础。只有翻过这座大山,AI在2B领域才能实现后续多场景的泛化和自主能力。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-08-04
2024-06-13
2024-04-11
2024-07-18
2024-07-01