OpenAI「补票」AI 搜索,SearchGPT 没有野心
发布日期:2024-07-31 07:18:48
浏览次数: 1807
来源:极客公园
SearchGPT 的初步表现令人质疑。尽管生成式搜索被认为是未来的搜索模式,但其幻觉问题仍然限制其发展。当地时间 7 月 25 日,OpenAI 宣布推出由 AI 驱动的搜索引擎 SearchGPT,并开启邀请测试,标志着 OpenAI 正式进军搜索引擎市场,直接对打谷歌、Bing、Perplexity 等一众公司。
围绕「传统搜索是否会被 AI 搜索颠覆?」这一话题,从 ChatGPT 出现的那一刻就开始了。然而 2024 年 1 月的数据表明,谷歌搜索依然保持着 91.46% 的市场占有率,霸主地位无可撼动。SearchGPT 的发布,似乎是 Open AI 对谷歌直接发起的冲锋。此举会对传统搜索产生什么样的影响?引起了业内广泛关注。如何评价 SearchGPT?要了解一款应用的第一步,就是去使用它。极客公园进入 SearchGPT 主页面,目前的搜索引擎还是以一个大文本框开始,询问用户「您在寻找什么?」。用户提出问题后,SearchGPT 则尝试组织和理解它们。据 OpenAI 发言人 Kayla Wood 透露,该服务由 GPT-4 系列模型提供支持,在发布时仅向 10,000 名测试用户开放。Wood 表示,SearchGPT 目前只是一个「原型」,OpenAI 正在与第三方合作伙伴合作,并使用直接内容提要来构建其搜索结果,目标是最终将搜索功能集成到 ChatGPT 中。在 OpenAI 对外发布的一个演示案例中,用户搜索「2024 年 8 月北卡罗来纳州布恩的音乐节」,搜索引擎会总结其对音乐节的发现,页面的右侧提供了活动的简短描述,左侧为内容来源链接。SearchGPT 搜索结果页面|图片来源:SearchGPT 截图除了对打谷歌,SearchGPT 的发布也标志着 OpenAI 与初创公司 Perplexity 展开了更直接的竞争,后者自称是 AI「答案」引擎。Perplexity 最近因一项人工智能摘要功能而受到批评,出版商声称该功能直接抄袭了他们的作品。OpenAI 似乎已经注意到了这一反馈,并对此采取了更为严谨的方法。该公司在一篇博客文章中强调,SearchGPT 是与多家新闻合作伙伴合作开发的,其中包括《华尔街日报》的所有者、美联社和 The Verge 的母公司 Vox Media 等组织。Wood 对此表示:「新闻合作伙伴给出了宝贵的反馈,我们会继续寻求他们的意见。」该公司写道,出版商将有办法「管理他们在 OpenAI 搜索功能中的显示方式」。他们可以选择不让其内容用于训练 OpenAI 的模型,但仍会在搜索结果中显示。OpenAI 的博客文章称:「SearchGPT 旨在通过在搜索中突出引用和出版商链接来帮助用户与出版商建立联系。」「响应具有清晰、内联、命名的归属和链接,因此用户知道信息来自哪里,并且可以在带有源链接的侧边栏中快速获取更多结果。」自从 ChatGPT 问世以来,OpenAI 一直在试图让其与实时网络更加紧密地联系在一起。而外界对该公司是否会直接做搜索产品也一直没有停止讨论,2 月份传出了它的开发情况,OpenAI 一直在积极挖走谷歌员工加入搜索团队。ChatGPT 的快速迭代赢得了数百万用户,但相对应的开发成本也在不断增加。The Information 近日报道称,OpenAI 的人工智能训练和推理成本今年可能达到 70 亿美元,而数百万免费版 ChatGPT 用户只会进一步推高计算成本。SearchGPT 在首次推出时将免费,而且由于该功能目前似乎没有广告,很明显该公司必须尽快找到盈利方式。在 SearchGPT 找到盈利模式前,网友先发现了幻觉。在前面提到的搜索「2024 年 8 月北卡罗来纳州布恩的音乐节」案例中,网友发现,「据该工具显示,该音乐节将从今年 7 月 29 日至 8 月 16 日举办一系列艺术活动。然而,如果有人希望购买其中一场音乐会的门票,那就麻烦了。事实上,该音乐节于 6 月 29 日开始,最后一场音乐会将于 7 月 27 日举行。 相反,7 月 29 日至 8 月 16 日是音乐节售票处的 正式关闭日期。(我已与音乐节售票处确认了这些日期。)」网友评论道,「OpenAI 的 SearchGPT 演示结果实际上并没有那么有用,显示的结果大多是错误的或没有帮助的,公共 AI 演示中出现幻觉的趋势仍在继续。」网友评论|图片来源:The Verge 截图这恐怕也是 OpenAI 将其搜索引擎作为「原型」发布原因之一——如果 SearchGPT 的结果不完全正确,公司可以说「这只是一个原型」,换取人们对它更高的包容度。其实,比 OpenAI 对生成式搜索还要耿耿于怀的,当属微软了。当地时间 7 月 25 日,Bing 尝试一种新的将生成式搜索与传统搜索结合的方式——AI 摘要功能。该功能预计会在几个月后正式上线,目前处在邀请测试阶段。Bing 表示,通过将生成式人工智能和大型语言模型(LLM)的功能与搜索结果页面相结合,必应的生成式搜索可以对用户的查询做出定制的动态响应。这种新体验将必应搜索结果的基础,与大型和小型语言模型(LLMs 和 SLMs)的强大功能相结合。它能理解搜索查询,审查数百万个信息源,动态匹配内容,并以人工智能生成的新布局生成搜索结果,从而更有效地实现用户查询的意图。在页面布局方面,用 AI 生成的信息占据了搜索结果页面的主体部分,传统搜索结果列表推到了页面右侧。Bing AI 摘要功能页面示意图|图片来源:Bing 官网事实上,2023 年 2 月,微软就推出了由 OpenAI 的 ChatGPT 技术提供支持的新版 Bing 搜索引擎,自那以来,Bing 一直期望用生成式搜索的加持追逐谷歌的搜索主导地位。1 年过去,2024 年 1 月,StatCounter 的数据显示,微软的搜索引擎在 2024 年 1 月的市场份额仅为 3.43%,比去年同期增长不到 1%。与此同时,谷歌的市场占有率为 91.46%,相比去年仅下降了不到 1%。生成式搜索的加成,并没有让 Bing 获得期待的效果,而这种落差在 4 个月后同样发生在谷歌身上。5 月 15 日,谷歌也推出了类似的功能,称为「AI 概览」,它将 AI 生成的摘要放置在搜索结果页面的顶部位置。谷歌 AI 概览示意图|图片来源:官方视频截图该产品推出后不久,用户发现该功能对某些查询的答案不准确,迫使谷歌手动处理部分回复。如今,将 AI 搜索与传统搜索相结合已成为常规操作。从过往数据来看,并没有证据显示,谷歌搜索受到了来自 AI 生成式搜索的挑战。而 SearchGPT 无论在产品形态还是技术能力,都没有和其它家产品拉开太大差距,因此极客公园推断,可能也并不会对海内外其它搜索引擎产品形成碾压。该产品的发布,也许会让用户有所增长,但不会让用户翻倍增长。这次发布看起来煞有介事,却更像在拉齐与其它各家搜索进化进度的一次公关行为。如此看来,就 AI 大模型替代传统搜索这一话题而言,远没有大家想象的那般顺利,但一切也并非毫无意义。在一众 AI 搜索中,最亮眼的仔当属 Perplexity。甚至可以说,这家公司是后来各家搜索 AI 化进程加速的催化剂。AI 搜索引擎初创企业 Perplexity,成立于 2022 年,刚刚成立就获得了 310 万美元的种子轮投资;次年 3 月,Perplexity 获 2560 万美元 A 轮融资,估值 1.5 亿美元;2024 年 1 月,完成 7360 万美元融资,总融资额超 1 亿美元,估值达到 5.2 亿美元;3 月初,该公司以 10 亿美元的估值融资约 6300 万美元;4 月,Perplexity 传出正进行至少 2.5 亿美元的新一轮融资,估值可能达到 25 亿至 30 亿美元。公布出的投资人名单也相当豪华,包括芯片巨头英伟达、大数据公司 Databricks、三星电子等机构,以及亚马逊创始人 Jeff Bezos、前推特副总裁 Elad Gil、前 GitHub 首席执行官 Nat Friedman 等多位科技圈大佬。在应用数据方面 Perplexity 同样表现亮眼,2023 年用户总查询次数超 50 亿次,安装移动 App 的人数超 100 万。在调查机构 Writerbuddy 发布的年度调查中,Perplexity 以访问量排名第 13 的成绩,跻身 2023 年度全球最火爆 AI 工具前 50 名。从机构与科技大佬们对 perplexity 的追捧,可以看出业界对 AI 搜索引擎长期看好;从不断增长的用户数据则可以看出,大众对 AI 搜索旺盛的需求。AI 搜索为用户省去了点网页、看网页、选内容的过程,直接对现有网页进行总结概括,给出一份类似调查报告的结论,相当于一个搜索助手。它最大的作用,应当是降低了用户的搜索时间,节省了人脑对信息处理总结所耗费的精力,以及提高信息的准确性。但是机器幻觉问题一直存在,Perplexity 也不例外。6 月,其聊天机器人就被爆出在缺乏直接访问原文的情况下产生机器幻觉,通过 URL 和搜索引擎碎片信息重建内容,生成看似准确的摘要,实则可能包含不准确甚至完全虚构的信息。这也是 AI 搜索在当下只能充当「助手」角色的重要原因。此次 Open AI 宣称推出 SearchGPT 的目标,是最终将搜索功能集成到 ChatGPT 中的原因,恐怕也是因为看清了这一点。因此,在各家技术能力差不多的情况下,未来 AI 搜索产品比拼的,是如何让搜索结果能够更忠于网页内容,且从工程能力和产品设计能力方面做出更体系化的整理结果,以解决信息准确度问题。很显然,这一问题 SearchGPT 还没有解决。
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业