微信扫码
与创始人交个朋友
我要投稿
上周五、周六参加了两天 #AICon 大会,中间还主持了一场关于大模型落地的闭门会(能进门的必须已经有实际落地经验)。周日沉淀一天,今天发个总结。
先介绍下 AICon,它和技术领域顶级会议 QCon 同由极客邦主办,是国内 AI 方向在工程技术、应用技术方面的顶级会议。据极客邦创始人霍太稳说,今年 AICon 参会人数已经超过了 QCon,可见 AI 已经非一般的热了。
这两个 Con 邀请的主讲人几乎没有老板,甚至 CTO 也不多,多数都是某个具体产品、方向的技术负责人,所以内容很实战。虽然搞 PR 的有,也会遇到公司限制不能讲这,不能讲那的,但因为是一线技术交流场景,主讲人都不想被同行喷,都想树立自己技术大牛的形象,所以在可能的范围内,干货输出是挺多的。
我们 AGIClass.ai 共去了四个人参会,散开听,再交流。总结如下:
模型厂商还拿不出像样的落地案例,Killer App 影都没有。产品和技术的主要精力还在追赶 OpenAI,提升模型性能上。
有场景、有技术的公司,对大模型相关技术的探索已经挺深了。哪怕是套壳,也套得很厚。效果不错,但还谈不上颠覆什么的,只能说值得期待,值得继续优化。但是不排除一种可能,就是效果太好了,可不能让别人知道。
搞微调的很多,甚至有做继续预训练的。但不少项目,辛苦做出的效果,用新模型不微调,大概率也能实现。在用量没上来前,微调的性价比优势也体现不出来。
多 Agent 已经是主流的构造应用方式。但这个 Agent 不是学术圈追捧的那种能做强 planning 的,而是工业界的一条专做一件事的 prompt,就可以是一个 Agent。
技术上基本只有做过没做过的区别,没有水平高低的区别。大模型相关的技术确实门槛比较低。但精细打磨出的 prompt,是道护城河,谁都不愿意告诉别人。
Prompt 玄学并非一劳永逸,不仅换模型、模型升级要重调,甚至在交付的最后一米,还要做定制。因为就算通用测试已经能跑通 90%,但个别用户就要那 10%,不得不针对性适配。交付工作量不低。
能不能拆出合理的 flow,以及把每个节点 Agent 调到最优是关键。这个 flow 不是简单映射人类工作的 SOP,而是可以更细。比如喜马拉雅分享的 AI 写作,写开头和写结尾的都分别是两个 Agent。
懂不懂业务,是能不能拆出合理 flow 的关键。这里的认知 gap,远大于技术 gap。抹平它,需要业务和技术的共同努力。
可能是技术大会的原因,感觉多数项目还是技术驱动的,而不是业务驱动的,尤其面向公司内部提效的特别多。不知道行业全貌是怎样的。产品经理们,赶快支棱起来啊!
点击阅读原文可以下载大会 ppt
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19