我要投稿

从 AICon 总结大模型落地现状

发布日期：2024-05-21 08:23:15 浏览次数： 1978 作者：嫑关注

上周五、周六参加了两天 #AICon 大会，中间还主持了一场关于大模型落地的闭门会（能进门的必须已经有实际落地经验）。周日沉淀一天，今天发个总结。

先介绍下 AICon，它和技术领域顶级会议 QCon 同由极客邦主办，是国内 AI 方向在工程技术、应用技术方面的顶级会议。据极客邦创始人霍太稳说，今年 AICon 参会人数已经超过了 QCon，可见 AI 已经非一般的热了。

这两个 Con 邀请的主讲人几乎没有老板，甚至 CTO 也不多，多数都是某个具体产品、方向的技术负责人，所以内容很实战。虽然搞 PR 的有，也会遇到公司限制不能讲这，不能讲那的，但因为是一线技术交流场景，主讲人都不想被同行喷，都想树立自己技术大牛的形象，所以在可能的范围内，干货输出是挺多的。

我们 AGIClass.ai 共去了四个人参会，散开听，再交流。总结如下：

模型厂商还拿不出像样的落地案例，Killer App 影都没有。产品和技术的主要精力还在追赶 OpenAI，提升模型性能上。
有场景、有技术的公司，对大模型相关技术的探索已经挺深了。哪怕是套壳，也套得很厚。效果不错，但还谈不上颠覆什么的，只能说值得期待，值得继续优化。但是不排除一种可能，就是效果太好了，可不能让别人知道。
搞微调的很多，甚至有做继续预训练的。但不少项目，辛苦做出的效果，用新模型不微调，大概率也能实现。在用量没上来前，微调的性价比优势也体现不出来。
多 Agent 已经是主流的构造应用方式。但这个 Agent 不是学术圈追捧的那种能做强 planning 的，而是工业界的一条专做一件事的 prompt，就可以是一个 Agent。
技术上基本只有做过没做过的区别，没有水平高低的区别。大模型相关的技术确实门槛比较低。但精细打磨出的 prompt，是道护城河，谁都不愿意告诉别人。
Prompt 玄学并非一劳永逸，不仅换模型、模型升级要重调，甚至在交付的最后一米，还要做定制。因为就算通用测试已经能跑通 90%，但个别用户就要那 10%，不得不针对性适配。交付工作量不低。
能不能拆出合理的 flow，以及把每个节点 Agent 调到最优是关键。这个 flow 不是简单映射人类工作的 SOP，而是可以更细。比如喜马拉雅分享的 AI 写作，写开头和写结尾的都分别是两个 Agent。
懂不懂业务，是能不能拆出合理 flow 的关键。这里的认知 gap，远大于技术 gap。抹平它，需要业务和技术的共同努力。
可能是技术大会的原因，感觉多数项目还是技术驱动的，而不是业务驱动的，尤其面向公司内部提效的特别多。不知道行业全貌是怎样的。产品经理们，赶快支棱起来啊！