微信扫码
添加专属顾问
我要投稿
"AI Agent(AI代理或者AI原生应用)是AI的终极未来,将替代我们手机上的所有App和操作系统,提供”即叫即到“的专家级服务。SaaS+AI就是AI原生应用吗?AI 原生的应用的真正含义是什么?本文将全面解读AI原生应用的核心要素”
01
—
• Harvey: AI律师
• Glean: AI工作助理
• Factory: AI软件工程师
• Abridge: AI医疗记录员
• XBOW: AI渗透测试员
• Sierra: AI客户支持代理
• CoCounsel: AI律师助理
• Coframe:AI网站增长工程师
02
—
03
—
这一轮的AI应用浪潮,不仅是技术的飞跃,更是交付模式的变革。在互联网与云计算环境下,产品服务往往局限于内容展示与简单的交互,我们称之为“内容服务”。这种服务由于缺乏“大脑”的理解和推理能力,难以像人类助理或者服务专员那样深入理解用户需求,也就无法提供深度个性化的服务。然而,AI Agent就截然不同,它不仅具备接近甚至超过人类的逻辑推理能力,而且聚合了用户的各种行为数据,并长期和用户进行深度互动,使得“行为智能服务”成为可能。AI Agent不再只负责传递与展示信息,或者简单的搜索查询,而是能够直接参与到用户的实际行动中,完成复杂任务。
因为大模型推理能力还会出现幻觉,开发团队需要花费大量的时间研究如何让模型的输出达到可用的程度。虽然对于一个没有用过 ChatGPT 的人来说,对话式机器人的输出很惊艳,但是在面对专业人士时,ChatGPT 的输出虽然很有专业的风格,但是细看内容的话,会发现它还是在一本正经地胡说八道,会存在不少错误,这在专业领域是绝对不被允许的。为了让它的输出能达到可以给用户交付的标准,这里面需要进行大量的“工作流拆解”、“分节点调优”的工作。在这个过程中,最高效的开发方式是“测试驱动开发”,即先测试出什么样的提示词和对话流程能够让 GPT 输出有用的内容,再围绕着这个流程开发产品功能。比如CoCounsel的团队就花了大量的时间在降低模型的输出幻觉上。他们试了很多方法,比如在提示词工程里添加足够专业的用例、优化搜索算法(把一次查询拆解成多轮查询)等。
新兴的A I Agent提供的是用“软件”来代替人力劳动。这意味着其潜在的市场不再局限于千亿的软件市场,而是一个以 万亿美元计算的服务市场。这样的A I应用企业出售的不再是软件而是出售工作。
“出售工作的含义是什么?” 以 客服AI Agent,Sierra,为例。B2C 公司将 Sierra 部署在其网站上,以与客户进行沟通。Sierra 的工作是完成解决客户问题的任务。Sierra 根据每次问题解决情况收费,这里不涉及传统的“软件坐席”概念,客户只需提供任务,Sierra 会执行该任务,并据此获得相应的报酬。
具备强大推理能力的AI应用将不仅仅是一个简单的工具,而是一个能够感知周围环境并独立完成任务且不断自我进化的“个体”。所以产品的设计不能选择工具化的场景,简单地提升现有的工作流程,而是要选择那些AI Agent能够独立自主完成整个工作的场景。
例如,CoCounsel 最初选择的场景是利用 AI 的能力,帮助律师们发现几个案例之间的相关性,从而更高效地获取信息。律师只用上传和自己正在处理的工作相关的文件,AI 会读取这些内容,并且推荐相似的法律案例,从而给律师参考,让律师更加清楚自己手上的案子该如何处理。这是有价值的,但是只是一个工具,只是简单改善了律师的工作流,只能算是个不错的渐进式创新,但依然没有在行业里掀起大的波澜。后来,ChatGPT 出现了,CoCounsel 重新开发了一个对话式的法律 AI 产品,客户可以像与 ChatGPT 交流一样和他对话,并给它布置任务,比如可以让它帮你阅读 100 万份文件,看看里面是否有某家公司欺诈的证据,然后整理出一份摘要。这样的产品交互方式很像给律师团队招了一个新的员工,而不是购买了新的产品,这极大地提高了他们的客户所在的律师事务所的人效,所以产品很快完成了 PMF。
再比如 ,Sierra AI主要通过OpenAI的GPT-4o、o1等模型打造了一个对话式AI Agent平台,主要聚焦在客户服务领域,可以混合处理文本、语音自动执行超复杂工作流程。包括客服咨询、退订商单、订阅更新等。Sierra AI可以帮助企业打造“数字化员工”将很多重复、枯燥、无意义的业务流程实现自动化,从而实现降本增效。
再以 XBOW 为例,XBOW 正在开发一款 AI “渗透测试者”。“渗透测试”或渗透性测试是一种模拟的网络攻击,旨在评估公司自身的安全系统。在生成式 AI 出现之前,公司只在有限的情况下(例如,出于合规要求)雇佣渗透测试员,因为人工渗透测试成本昂贵:这是一个由高度熟练的人员手动执行的任务。然而,XBOW 现在展示 了一种基于最新大模型推理能力 的自动渗透测试,其性能可媲美最优秀的人类渗透测试员。这极大地扩展了渗透测试市场,并为不同行业和规模的公司提供了持续执行渗透测试的可能性。
AI Agent不是简单的“GPT 套壳” ,如何降低模型的输出幻觉至关重要。当智能体真正尝试为客户解决问题,并实际完成工作时,需要像一个优秀的员工一样出色,才能让客户买单。这就要求在AI Agent开发中,为提示词添加示例数据,构建测试集数据变得极为关键。为了这个目标,AI 应用开发团队需要建立独家的业务数据集,比如行业的专业数据集。在前面提到的CoCounsel的开发中,具备专业律师背景的产品团队就积累了专业的法律案例。但是这还不够,o1模型的出现,让人们看到了思维链的强大之处,CoCounsel 的团队又开始了对思维链的探索,比如邀请全国最优秀的律师来分享自己解决复杂法律问题时的思考过程和工作流程,来获得更多思维链的训练数据。
私有数据集的质量将决定AI应用的能力,如何构建一个高质量的私有数据集将是AI产品经理要优先考虑的问题。
03
—
这上面所有的一切,构成了“AI原生”应用产品的特有的模式,也形成了其独特的竞争壁垒。
这样的“原生”的AI应用公司与现在的云计算软件公司呈现出了不同的面貌:
• 定价模式:云计算软件公司基于使用定价,而AI公司按照完成的工作收取报酬
• 云计算软件公司专注于软件利润池,而 AI 公司则聚焦于服务利润池。
• 云计算软件公司通过按座位收费出售软件。AI 公司通过结果导向的方式计费。
• 云计算软件公司倾向于采用自下而上的无缝分销模式。AI 公司则越来越多地采取自上而下的方式,注重客户交互,追求高度信任的交付模式。
• 云计算软件公司采用PRD 驱动的敏捷开发和 AB 测试;AI公司的实践证明了测试和数据驱动的开发是最有效的开发模式。
所以AI 应用开发不是简单的给SaaS软件增加AI的能力(比如支持自然语言交互),而是全新的产品的理念和模式,其中私有数据集和认知结构的构建尤其重要。
随着AI应用的不断发展,未来,你不必花费大量的时间和金钱在一个地下室逐页阅读文档,而是真的有个 Agent 能和你一起进行战略性的智能思考,这不仅会让工作变得高效,更会让工作更有意思。AI Agent将替代我们手机上所有的APP,甚至替代各种操作系统,为我们提供各种”即叫即得“的各种服务,所有的行业都值得我们用AI Agent来重新做一遍。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-25
2024-07-20
2024-11-06
2024-07-18
2024-08-13
2024-11-02
2024-07-25
2024-09-06
2024-12-25
2024-07-24