我要投稿

崇拜Agent和崇拜ABtest是同一种病

发布日期：2025-04-29 21:12:01 浏览次数： 1522 作者：搞AI的K同学

Agent执行任务时，假设每一步都是0.9的成功率，10步以后，整体成功率就只有0.35了——漏洞百出的流水线，指望通过大量生产来找出侥幸的合格品。

最讽刺的，他们说："没关系，只要用户的任务跑得足够多，那些被采纳的结果就能告诉我们系统擅长什么，把这些成功案例当showcase就好。"

但，这真的不是拿用户当小白鼠吗？

Agent的尽头是Workflow

仔细分析那些最终被验证成功的Agent路径，更像是大力出奇迹、列出那些本来就存在的Workflow：穷举所有可能路径，找出真正有效的——这本应该是产品设计初期就该做的工作。但崇拜Agent的人偏偏要鄙视Workflow的"局限性"，宁愿消耗海量算力和用户耐心去测试"最佳路径"。

这让我想起了经久不衰的关于产品经理的讨论：

古典互联网产品经理：靠洞察和强主观判断构建产品
AB测试型产品经理：靠大规模测试下的数据支持

问题来了，AB测试型产品经理诞生于C端大流量产品疯狂增长的移动互联网中后期。抖音调整一个小按钮，前端用户几乎感知不到成本，可以瞬间产生反馈数据。微信视频号调调算法，前端用户最多多划俩视频，用户感知很低。

但啥时候珍贵的B端用户甚至 Prosumer也成了大规模AB测试的"燃料"？

消耗信任比消耗算力更可怕

无论是Agent还是Workflow，高留存一定建立在高可用上。

在当前Agent可用性还远未达标的情况下，就大肆宣传其"通用万能"，结果只能是：

用户对技术普遍失望
产品和概念快速祛魅
获客成本暴涨

无需纠结到底是谁在"拿着锤子找钉子"或者"拿着钉子找锤子"——这一次，被当成实验对象的"钉子"不是没有感知的物品，而是真实的人。人会错误和失败挫伤——当消耗掉了人们对某种产品的热情和好奇，口碑的反噬一定会反映到获客成本上。

你很难想象微信是通过AB测试试出来的。伟大的产品往往来自对用户需求的深刻理解和前瞻洞察。与其把用户当成廉价QA，不如在产品设计阶段多下功夫、而非醉心于高端的技术架构。

毕竟，失去的用户信任，比消耗的算力要昂贵得多。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

Playwright + MCP：用AI对话重新定义浏览器自动化，助力提效300%

2025-04-29

牛逼！DeepSeek一键转word/excel/PDF文档，90%的人都不知道的隐藏技能

2025-04-29

DeepSeek实现办公自动化，从PDF数据提取到HTML图表生成

2025-04-29

Cursor 生产力教程 v0.1: 小白快速上手指南

2025-04-28

为什么你越关注AI，越容易落后于人？

2025-04-28

AI 焦虑的解药

2025-04-27

职场人效率狂飙密码！10 款 AI 神器让你告别加班，卷赢全场

2025-04-27

警惕AI滥用陷阱：这些场景根本不需要AI

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

万字长文：人人都能学会的提示词，揭秘18个prompt模版，8个秘诀，助你AIGC从入门到精通，从可用到好用

2024-04-02

可灵AI的网页版上线了

2024-07-07

办公新利器：DeepSeek+Word，让你的工作更高效

2025-02-02

千万别用可灵AI复活老照片！

2024-06-24

苹果Mac用户的福音：本地运行Meta Llama 3的终极指南

2024-04-27

xinference + dify + ollama 构建本地知识库

2024-05-08

一个叫李星玮的上海交大博士火了！GPT4-o通过数据分析出他100%的渣男属性！

2024-06-06

一种可复用的AI提效方案：AI点灯

2025-01-03

超全总结！大模型算法岗面试真题来了！

2024-04-02

国内20家公司大模型岗位面试经验汇总

2024-05-04

大家都在问

为什么你越关注AI，越容易落后于人？

2025-04-28

AI来了，高绩效员工反而不开心？

2025-04-20

Cursor 深度评测：革命性提效工具还是过誉的玩具？

2025-04-04

Flowith AI Agent，能否取代 Manus？

2025-03-24

现在的AI ，赋能软件开发，效能到底能提升多少？

2025-03-24

DeepSeek 越强大，我就越容易变蠢？

2025-02-15

AI正在如何重塑未来职业发展路径？

2025-01-13

为什么大多数人不愿意接受AI？

2024-12-26

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB