AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


入口之战:AI 时代的「二维码」,在哪里?
发布日期:2024-08-03 17:33:34 浏览次数: 1939 来源:赛博禅心


写在前面

2011 年 11 月,微信更新了 v3.1,首发于诺基亚的塞班上,带来了「二维码」。一周后,这一功能也上线到了安卓和 iOS。

来源:微信官网


2012 年 5 月,张小龙发了一条朋友圈:“互联网的入口在搜索框,移动互联网的入口在二维码。”

张小龙发的朋友圈


故事的结局大家都知道,微信赢下全场。

那么,AI 时代的「二维码」,在哪里?

以及,在 AI 时代,会不会有可以深挖的地方,而不是一味追求去粗暴的「卖课」?


二维码的复盘

思考:移动互联网兴起的时候,我们撞出了哪些生态缺位?

我认为:新的流量,尚未与传统需求打通


智能手机兴起的时候,我们有了即时信息交换的需求,并高位替代“打电话问问”。与 PC 流量相比,更能满足在不同场景所需,如:几个人起意决定去吃东西,通过手机可以迅速搜索、预订、导航等。

但很显然,传统服务端并未满足这一变化(也无从满足),导致一系列的体验断层。而二维码的出现,借用手机的摄像头,通过扫码的方式,让信息可以「无人值守」的快速传递。


在实际落地中,「双边效应」是二维码能快速普及的一大原因。

回顾 2013~2015,微信支付刚刚兴起,那时:很多用户询问商贩是否支持扫码付款;另一方面商贩主动向用户展示收款码。这种互动推动了「扫码」的快速普及,形成了良性循环。

「我扫你」这个词,也被出口了


进而,我们发现,如果希望一个东西快速承接新的场景流量,就有两条可行策略:

  • 需要绑定人与人、人与事儿之间的高频场景(引起行业自推广)

  • 需要让用户,无需额外成本,用手里的东西就可以完成(降低推广门槛)

于是,我们看到了在支付、登录、加好友上,扫码成了必然。同时,微信也成为了大家通用的扫码枪。


AI 的不同

在我看来,AI 从产业角度,带来的是信息处理的不同:

  • 互联网时期:你输入一个问题,由人或者机器,把相关的材料找到,然后返回并展示给你

  • AI 的当下:你输入一个问题,AI 检索到材料(来自你的提供、AI 的训练数据,数据库或者联网搜索),然后生成并展示给你

因此,当有需求时,我可以把所有信息都提供给 AI,让它筛选和录入,并根据我的输入识别意图,以更好的方式把结果返回给我。如果数据是实时、自动注入的,这就是所谓的 Copilot 模式。

我用 coze,搭了个公众号排版器


顺道提一嘴,在当前的路径下,AI 不存在「又变天了」。大模型从头到尾只在做一件事:输入足够的信息,然后输出相应的内容。如果用 y = f(x) 来表示,大模型做的事情就是:

结果 = 大模型(提示词)

在产品里,这个过程可能会不断重复,比如在 agent 场景中的反思,就是让它先用 f(x) 输出一个结果,再用 g(x) 来检查。而多轮对话,就是把 f(x) 中的 x 改成历史对话。

再多嘴一句,绝绝绝大多数的 AI 产品,都只是对大模型 API 进行简单封装,找到着力的业务场景,结合行业 knowhow 和交互优化,来做品牌创新。

AI 在应用层,从来不是技术驱动。


AI 的缺位


首先,我提一个暴论:人类对AI的使用,既没有先天的基因,也没有后天的学习。因此使用门槛极高,存在巨大的差距。要弥补这一差距,需要在交互上进行创新。


如何理解“先天基因没有”?

在历史上,如果有两批男性,一批对军事和政治更感兴趣,而另一批则兴致寥寥,那么我们会认为,前者更适应人类社会的竞争,并会更广泛地传播自己的基因。进而,现在的男性普遍更喜欢竞技类和策略类的事物,也更喜欢看相关视频和玩这类游戏。

相比之下,AI是一个全新的事物,没有经过这样的社会达尔文过程,因此没有人天生会使用AI。

我们终其一生,在学习和基因共存


如何理解“后天学习没有”?

骑自行车是一个反直觉的技能,与AI有些相似。人们需要通过长时间的学习和训练才能掌握骑自行车的技巧。自行车经过了长期的发展,虽然不在学校课程中,但我们从小就看到身边的人在使用,也有各种各样的辅助工具(比如侧边的小轮子)。

而AI呢?刚刚崛起,变化迅速,没有现成的学习工具和环境。因此,我们需要创造一种新的方式,将AI的使用与我们已经熟悉的事物相结合,降低学习成本,让更多人能够轻松使用AI,真正发挥它的潜力。

iPhone 在最早期,大量使用了拟物设计,方便人们理解


额外

做产品的时候,要顺人性,有一个事实是:我们在接受教育的普遍过程,是被动灌输,而非主动提问。

那么,一个更符合当下用户需求的产品,不应让用户主动提问:应预设一个场景,让用户参与

截图来自知乎


我的实践

作为 AI 从业者,我自己也在思考,如何更好的和 AI 进行交互。也尝试贡献了一些方案:

  • 前几天热议的「浏览器滑词弹框」交互,可能是我最早用在 AI 上的。去年 2 月,我写了款开源程序 Fluentify,可能是最早一批“AI 浏览器插件”,带来了划词弹框和右边栏的交互。

  • 去年收到 OpenAI 的邀请,在 ChatGPT 里实现了联网和搜索。

  • 应该下周的时候,我还会带来一些新的交互

Fluentify 带来了「划词+侧边」,大概是去年 2 月


Fluentify 被 FuturePedia 评为了本周最有趣的项目


于此同时,作为产品经理的我,也在寻找更多更好的解决方案:

  • 更好的陪伴响应

  • 更好的信息输入(不应该是让用户主动发问)

  • 更好的信息呈现

  • 无需用户额外购买设备


好的探索 - PC

先说 PC 端,这里我认为最佳实践是俩:

  • Copilot

  • Copilot

你没看错,都叫 Copilot - 微软这胡闹的品牌部门,简直瞎搞 ahhhhhh

前者是 Github Copilot,代码补全工具,或者说是这一类工具(比如前段时间我介绍到的 MarsCode)

他懂 114514,很牛逼


后者是 Windows 里的期货,可以帮你自动操作电脑

注1:夸赞仅针对发布会里的演示视频

注2:产品以实物为准,谨防电信诈骗


这俩都有相同的特点:

  • 在不破坏原有流程的前提下,集成到了工作环境中

  • AI 自动进行实时的数据录入

  • 以用户熟悉的方式,进行处理结果交付(比如代码自动补全在各种 ide 里都有)


我们通常认为,PC 负责生成,工具要偏向于生产力工具;手机负责消费,让你快速体验到奶头乐。因此在落地的时候,会看到移动端的一些不同:

  • 优势:更加一致&有效的交互方式,比如语音输入;更多传感器

  • 限制:不能常驻后台,但要处理各种即时访问(如果做高频场景)

  • 挑战:解决输入问题,解决跨应用的结果交付问题


好的探索 - 手机

移动端中,在过去一年里,我看到的2个有趣的尝试:

  • ChatGPT 小组件

  • 海螺的悬浮球


先说 ChatGPT 的小组件,允许你将 ChatGPT 放到锁屏页面下,点一下就能打开,在这里:

  • 缩短了用户「从现实业务」(手机并没有被打开),到 AI 询问之间的路径

  • 变相实现了「AI」常驻前台

  • 但也存在一个问题:这种操作还是颇为小众,所以相信用过的人不多

大概长这样


海螺的悬浮球,算是小组件的升级版:允许 AI 长期处于待命状态,放在屏幕最上层。形态就是系统层级的 Assistive Touch,辅助触控。就是这个小圆圈,点一下就能呼起自定义功能。

我假定:你知道海螺是 MiniMax 旗下的 ChatBot


冷知识:辅助控制是为了帮助肌无力,无法按下 Home 键的朋友设计的,之后广受好评


我可以把唤起行为,改成海螺提供的「识别屏幕」


这里有几个设计上的巧思:

  • 屏幕上的小圆圈,这个交互来自乔帮主,iPhone4 时代的产物,iPhone 用户挺熟悉的

  • 唤起的方法,是通过捷径实现,过程是明牌,避免了隐私麻烦

  • 默认的交互是发送当前页面截图(有手机上 copilot 的感觉了)


用起来的话,典型的场景是... 我拿他去写评价,薅个代金券

点评/美团/饿了么,完美伴侣


另一些我认为比较合适的用法,包括不仅限于教你打游戏,帮你算满减,帮你规避套路,等等。毕竟这些场景下的所有信息,都没办法直接复制,只能截屏。

杀戮尖塔 yyds


但还是得说一下,目前大模型对于图像的识别,以及指令遵循,还没有到非常好的程度。但我相信他会很快进化的,等风来就好了。


我再顺着给悬浮窗多设计一个交互 - 长按(这个不一定能通过「捷径」实现):

  • 长按后,唤起语音对话

  • 长按结束后,将语音和当前屏幕内容发送(左右滑动,决定是否发送屏幕信息)

  • 获取到 AI 的反馈后,可以一键复制,并进行包括不仅限于:进入对话,修改文字和追问等操作


比如在我炉石的时候(马上回归了!),面对一年没打的手牌,就可以让 AI 随时 copilot 的为我服务了。

停服?什么时候停服过?


SuperAPP,在哪里?

提问:SuperAPP 的机会,在哪里?

我的回答:机会可能不多


这个问题,在过去的一年里,我被很多朋友问过。我的思考很简单:

  • 在以往,一个准 SuperAPP 在崛起的之初,因其先发优势,心智势能和资本开挂,在进入大众视野的前几周、几个月,可以迅速获得市场认可,进而成为头部明星。

  • 在当下,由于 AI 和类 Coze 产品的出现,点子可以被快速复制&落地,其流量也将被迅速分化,进而无法形成品牌合力(因此我一直在关注 Coze,并常与人说:Coze 是 VC 最大的竞争对手 - 它猎食了独角兽)

glif 做了个爆火的梗图生成器,几个小时后 coze 上到处是复刻


时代机会,在哪里?

我觉得:在「超级入口」,人与 AI 共生的超级入口。

当功能本身不再是壁垒时,心智资源则变得弥足重要,要让你的产品成为用户的肌肉记忆,比如扫码微信


去年二月,我做了一场分享「与AI共生」


在未来的时间里,AI应用将更加注重如何无缝地融入用户的生活、工作以及其他场景,以更直观有效的方式与用户进行交互。这种交互,或许是类似 copilot 的实时补充,也或许会像锁屏按钮一样,不打扰地守在用户身边,直到一次触摸发生。

但最佳实践是什么,依然需要我们这些从业者不断地从各方面进行试探:无论是 transformer 的路线创新,还是 openai 的工程实践,又或是上文中所提到的悬浮球交互。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询