微信扫码
与创始人交个朋友
我要投稿
约尔最近邀请了几位神秘嘉宾参与了一期关于 AI 搜索的讨论。本号不追热点,只聊只写基于实践的观察和思考哈。
同样的免责申明:以下为编辑视角的串讲,没有一致的态度倾向,请读者自行辨析事实和观点、共识和非共识。
大的主线是:1)搜索 query 变长和语音提问是趋势,低龄儿童和不会用输入法的人是 AI 搜索/Chatbot 可以关注的潜在用户;2)AI 搜索在国内就是典型的小红书和抖音的机会;3)数据源是 AI 搜索的关键壁垒,但在具体场景里提升效果仍然需要海量人工投入;4)搜索会分化,需求由不同的垂直应用承接,但全新独立产品从搜索到内容平台的路很难走,对商业化和 marketing 的重视度需要提高。
目录
01 用户行为的变化:query 变长、语音输入
02 垂直场景的 fun facts:娱乐八卦、实用信息、电商导购
03 大厂的禀赋和决心:独特数据源是壁垒,但基建投入需要人力
04 新产品的美梦和突围
4.1 从搜索到内容平台
4.2 广告可能仍是商业化的最终解
4.3 同质化竞争的时候,市场比产品重要
在输入框没变、交互形态没变的前提下,人们在搜索时输入的 query 已经越来越长,AI 进一步改变了用户检索信息的习惯。过去的搜索是用户自己要先把想搜的东西做好拆分,在关键词之间打空格或打逗号,百度的 query 在一几年的时候平均是小几个字,到二几年以后很多都在 7 个字以上,现在在 AI 场景下 query 字数变得更多,长度是传统搜索引擎的两倍以上,越来越接近日常的自然表达,省去了原来组织语言、思考查询词的过程。
AI Chatbot 更强调多轮,交谈过程中的每个 query 可能比较短,问完一个问题,如果模型回答得不好,还可以通过多轮的方式逐渐修复对用户问题的理解,从而答得更好;而 AI 搜索更强调一上来就理解用户的意图,需要拆 query,在知识型的 AI 搜索产品里,用户的 query 更是特别长,甚至有时候不是一句话,而是在说一段话。在海外也有类似的现象,Google 的 query 平均词数为 2-3 个,而 Perplexity 里大约是 10-11 个词。
语音直接问更符合人类直觉,但需要解决更复杂的 query 理解问题。query 长度的增加在上了语音表达之后更加明显,其实就是说话说得越来越碎了。这个行为是不可逆的,一旦降低了门槛,再让人主动去学就有点反人性了。专门去挑语音输入的 case,尤其是是儿童的声音来听,会发现很多人是说不清楚需求的,现在 query 理解的难点更多在于对自然语言里表达的语序、结构、车轱辘话来回说的拆解,比传统搜索引擎内更加复杂。
面向儿童的 AI 产品有更天然的 PMF。专门的 AI 搜索产品的用户在今天仍然更多是学生、白领、工程师、市场营销等属性,搜索的都是比较高端的知识,比较效率型。成人使用 AI 助理的频次较低,PC 端还行,手机上的留存确实要差一些;但小孩不同,360 做的儿童智能手表,即使下架了,问任何问题都会说暂时不能回答,这样一个已经不能用的产品,仍然有一半的日活用户。可以想见,等这些小孩逐渐长大,会更习惯于语音输入,和我们的习惯会很不一样。还有以前不是传统搜索的用户,例如有 6 亿不会用输入法的中国人,将来可能也是 AI 搜索/Chatbot 的机会。
豆包:
小红书之所以和搜索挂钩,一个关键点是它有新的信息源,平台上的信息被持续地高效地生产出来。2018 年的小红书,你会觉得它是一个社区,和购物关系更大,不会觉得在能上面通过搜索来解决你的生活问题。到了 2022 年,你要去查哪里可以做核酸,感觉只有小红书能解决这个问题。2023 年知乎内部有一个用户调研发现搜索心智掉了一半,那一半全部都去了小红书。小红书的厚积薄发在于平台上积累了过去十年中国人在生活中的各种长尾信息,内容深度非常深,有活人来实时回答各种非常细的小问题,使得它的搜索性质很强。
数据源是 AI 搜索的关键壁垒,AI 搜索在国内就是典型的小红书和抖音的机会。因为第一有用户需求,有搜索心智;第二本身是以内容见长的平台,独有的数据源能支撑着 AI 再去生成新内容;第三有能力去把这些内容进行抽取和结构化;第四可以在未来的效率提升和中心化运营上做很多事情。
至于说从 AI 搜索出发能不能成为一个单独的内容平台,今天内容的定义已经比较泛了,只要能够提供某一种信息或者互动,就是内容,比如商品也可能是一种内容。而这样的内容未来规模有多大,覆盖率有多高,以及不管是从公司角度还是从技术角度,需要为此付出的基建成本、纠偏成本、内容可用性成本等等其实是真实存在但隐形的,毕竟这些内容一旦以官方服务的方式提供出来,准确性和可用性需要有一定的保障。
如果进一步强调 AI 搜索中信息的「有用」,AIGC 的难点其实在训练集里,内容的多样性是不够的。例如在电商导购场景里,只按照基础的训练模型讲解的话,哪怕 AI 能讲出个一二三四五点,也都还是大家的常识,没有办法基于这个商品本身的类型、特性等给出更多更有价值的选购意见。买冲锋衣、买瑜伽裤怎么选,需要很多背景知识,但这些背景知识并不是全网共识,而是需要很多的外部输入,以及想要再结合更细的品类和具体的品牌,并且判断哪些数据是真实可信的是有帮助的,就会导致海量的人工投入。只要大厂有决心,其实招几百个外包也可以,但想做的事情足够大的时候也不能无限堆人,只能寄希望于在训练方法上再去找一些突破。「曾经梦想成为一代勾勒各种理想态的产品经理,到头来还是成为了一个标注头子」。
4.1 从搜索到内容平台
搜索将来会不会分化?其实搜索已经分化过,以前在百度里大家都搜商品、搜本地生活,后来这些 query 逐渐落到了大众点评、汽车之家、淘宝等场景中,但百度仍然占市场的主导地位。背后的逻辑其实是,搜索需求本身就很难被一个产品收住,垂类的搜索需求会随着服务能力的延伸慢慢被垂直平台分走。这个趋势将来在 AI 上还会重演,只不过可能是其他垂类。替代很难,但分一杯羹是有戏的。
海外 Perplexity 的流量一直在涨,业务上从单纯的搜索变成了最近的动作几乎就是在做内容,让用户可以生成一个 Page 把内容沉淀下来,APP 的第二个 Tab 就是在做今日头条满足的需求。Perplexity 现在做的 AI 整理互联网上的数据,但是还缺少人类自己输入的数据,下一步可能就是让用户很快地把一些简单的但是实时性高的或者是地理位置相关的数据给补进去,否则 Google 的统治就太强了,信息源还是没有变化。
从另一个角度来看,现在每天全网的短视频发布量是 1.5-2 亿个,不管是量还是质都远远解决了供给问题,图文就更不必说。做过尝试,通过大模型去生成内容,解决了门槛的问题、量的问题、效率的问题、成本的问题,最后发现还是没有办法 PK 过已有的这些大平台能够带动的 UGC 内容生产,相比之下 AIGC 出来的东西在整个互联网的内容供给中都是毛毛雨。虽然 AI 辅助创作能让特效和动捕等变得更轻松,在制造爆款上提升效率,一个好内容的价值超过 1 万个不好的内容或者普通内容,但对于搜索来说,AI 生成的大部分信息如果无差别地沉淀下来就会变成污染了互联网的脏数据。现在去训的数据挖到最后发现有些也是 AIGC,这个就很崩溃,未来对于内容真实性的识别更会成为广泛的难题。
一个冷知识:其实百度早年也走过搜索和内容互通的路,只不过产生内容的是人。贴吧本为搜索而设计,但逐渐被推荐算法这种更中心化和更高效的分发方式所取代。P.S. 1)此处不提贴吧衰落的内因,2)此处不展开对海外 Reddit 的分析
熟练用户会发现谷歌上带空格组合词搜索效果好而选用谷歌,但更多用户常使用长关键词和疑问句搜索,百度贴吧和百度知道经常能对此提供帮助。
贴吧、知道等产品就是顺应互联网定义的变化而产生的,引导用户创造大量口语化的讨论和问答,满足用户关于冷僻内容、突发内容、问句搜索的需求。反过来,当用户这方面的搜索体验改善后,又会养成更多这样的搜索习惯。
《俞军产品方法论》
4.2 广告可能仍是商业化的最终解
想来想去还是觉得广告的商业模式很好,是一种注意力货币,可以做各种各样的交换。不像买会员,你一定要有这个需求了才会付费成为我的会员;对于广告,理论上你有任何别的需求也可以在这里进行价值交换,只要产品辐射的范围够大,用户对推荐的东西不是很抵触,不会出现广告内容与场景非常违和的情况。
口嫌体正直,广告就是比会员赚钱。百度的竞价广告里最赚钱的是医疗,医疗里最赚钱的是男科。一个不孕不育的搜索需求背后顶得上 Perplexity 开好几个月的会员。Perplexity 最近也开始推广告做招商,选了健康、金融、时尚购物等一些垂直的品类以及一些像耐克这样的高端客户,希望提升自己的品牌形象,在产品中会通过赞助问题、答案主体、相关问题和网页侧边栏等多种形式植入广告。
在 AI 搜索中插入广告面临召回率的挑战,还需要时间来验证商业化。只有当用户确实有相关需求,例如主动询问手机应该买什么品牌时,插入广告才不会显得生硬。但与广告匹配的搜索需求在整体中的占比很低,用户的提出的问题里可能只有 10% 适合加广告,再经过点击等漏斗层层过滤后,最终能带来收益的部分非常少。如果这个问题解决不了,挣不到足够的钱,商业化就不成立。对于 Perplexity 来说,跑通的话至少可以作为付费订阅之外的一个收入来源补充。
4.3 同质化竞争的时候,市场比产品重要
产品卖点的接地气和夸张化让普通用户更容易记住并选择。《跨越鸿沟》最重要的一句话是「早期大众和早期使用者无法相互参考意见」。之前有段时间 Kimi 在所有渠道都狂讲「长文本」这件事,这种营销才是对的, 而同期阶跃在打「多模态」,MiniMax 在打「MOE」,在这三个概念里,只有「长」能被用户理解,其他两个词都很抽象,用户并不关心。是可以识别图,但好像也没那么多图要天天用,但一说可以「50 个 pdf」,「从《三体》里找到某一句话」,那一下子就懂了,很接地气,用户很难有这么极端的用例,但如此夸张就会让人印象深刻。大部分用户没有那么多的判断逻辑,没有择优的敏感性,很多时候一个产品本身没有那么强,但用户就是记住了,然后就选择它。「被记住等于被选择,而不是优秀等于被选择」。
找垂直领域的 KOL 做投放成为共识。AI 博主能 cover 到的用户早就被洗了无数遍,投放效率是差的,国内外开始同样在找学生、宝妈、健身等垂直领域的博主,海外还多了国家和地区这个维度需要额外做区分。把产品的能力翻译成那个领域的需求和那个领域的人能听懂的话去做 marketing,他的痛点是什么,用什么样的表达方式才会有共鸣,这不是工程师能解决的问题,业界有公司会找一堆垂直领域的实习生来做。除了做增长的通用路径上的基本功之外,还有一些带杠杆的方式,例如能引起社交传播的内容,需要有足够强的敏锐度去察觉以及足够高的执行力快速试错。今天的 AI 软件仍然深度依赖于移动互联网,获客效率可能是现在 AI 公司的核心能力,甚至比产品力都更重要,因为产品差异化没那么大。
大家很多时候会高估产品的差异化,低估市场的差异化,从一个生意的角度来看差别太大了。在融资的时候可以跟 VC 讲,在销售的时候可以跟客户讲,我比我的竞争对手多做了一些功能,这些功能可能只有 5% 的用户会用,在解决用户的问题上其实是不重要的,但在 marketing 上是重要的。产品差异化有时候不是产品本身的竞争力,而只是说服投资人、说服客户的竞争力。在一个行业里,产品可能是一样的,但用户量是不一样的,用户量最大的公司收入不是最多的,收入最多的公司利润不是最高的,大家的差异来自于用户增长逻辑的不同,投 KOL、口碑传播、线下销售、和大厂绑定搞关系走渠道等等,这都是一个个不同的生意。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-22
告别加班!这款 AI 数据神器,让你像聊天一样轻松搞定数据!
2024-12-21
全网最全ChatGPT财务分析提示词解决方案
2024-12-21
万字长文梳理基于LLM的Text-to-SQL发展进程
2024-12-20
从0到1解构数据问答系统架构:三层模型全解析
2024-12-19
博士眼镜 × 观远数据 × 飞书 | AI 和 BI 赋能业务实践
2024-12-19
传统水务如何借助AI完成智能化升级?一文看懂核心架构与实战应用!
2024-12-18
ChatBl有什么用,看这篇就够了!
2024-12-18
在Windows上使用RAGFlow+Ollama+Qwen2.5,搭建医疗问诊助手(附相关数据集和案例)
2024-06-20
2024-06-14
2024-07-03
2024-06-06
2024-06-14
2024-06-21
2024-06-16
2024-06-07
2024-07-24
2024-10-09
2024-12-13
2024-11-19
2024-11-06
2024-10-25
2024-10-25
2024-10-25
2024-10-18
2024-10-09