前言
本文主要内容为提示词工程师的工作实际经验和感悟。
详人所略,略人所详。
Prompt领域的优秀教程越来越多,基础知识可以参见社区先辈刘海同学:[23.08] 网上疯传的「AI 提示词工程师」到底是什么?
(这篇写得实在是好,我想不出任何不推荐的理由,提示词工程师必读好吧!刘海先辈受我一拜!)
大量的使用技巧,案例在LangGPT社区里也数不胜数,此处不赘。以下为正文
与大模型对齐的人类工程师
作为Prompt工程师就职,已经有三个月了,我的主要工作内容如下
大模型公司还是要接单子的嘛,我在的公司目前还是一家创业公司,人员有限,每个人都得当多面手。销售出去见客户的时候,很多技术问题细节回答不了,这个时候就由我出场了。勉强算是个技术人员,这几个月跟着销售面见了大量的客户,去了很多业务现场,积累的不少实际的业务经验,本身对你写prompt也是有帮助的,你只有知道了客户是在什么样的场景下去用你的大模型,现场是解决什么问题,你才能更好的去调整prompt,Know why才能Know how。现在都是业务强导向,售前的这个活我也挺乐意干的,和客户现场交流的时候也需要捕捉他们的需求,另外也需要你为客户展示模型能力,现场根据客户的需求编写prompt,简单验证下场景。去帮助客户去梳理大模型的技术能够在他们的业务链条里怎么接入,解决什么问题,提升多少效率。有点AI落地解决方案的意思在。emmm这几个月算是写了不少技术方案,锻炼了产品能力?我还挺喜欢跟着销售大哥到处跑的。未来AI肯定会慢慢改造所有行业,现在能直接去行业一线,去了解早期AI时代大模型是怎么被打磨成一款产品打包应用出去的。这是非常宝贵的经验。这部分工作我主要归结为售前技术支持,需要你懂一些技术原理。prompt工程师你不可能和算法、和研发去比代码能力,那么体现价值的地方就是你比研发懂业务,同时比销售和交付更懂自家大模型。
上面讲到我会直面客户现场,和客户有很多沟通交流。交流最重点的一部分,就是得了解客户手上有什么样的数据,有多少量的数据,哪些数据是可以处理,然后拿去给大模型训练或者微调用的,哪些是价值不大的数据。这会涉及到不少跨部门合作,你需要和算法同学商定这批数据怎么处理,标注哪些内容;决定好怎么处理数据后,就得开始布置上数据挖掘方案,和标注的同学一起确保数据产出的质量。因为有时候数据是海量的,我们又缺人,所以我也经常和标注同学一起去处理数据+质检......有多少智能就有多少人工,虽然大模型本身已经预训练完成了,但是根据特定场景或者行业垂直场景需求,依然有大量数据需要人工去处理。作为prompt工程师,也得清楚微调的全部流程,微调前期最重要的工作就是数据的处理,你知道这个特定任务的数据是哪些,你才能更好的去调试prompt,去找prompt的编写技巧。
有了以上两个环节后,其实才进入到具体的Prompt设计环节,这个时候你已经比较清楚业务需求+数据样本了,那么你以为prompt就很好编写了吗?我知道现在有大量优秀的prompt框架,社区里很多大佬极其牛逼的提示词,用在ChatGPT4.0里,效果华丽,近乎炫技般。但是国产大模型和ChatGPT真的不是一个东西,而且会极大的受限于客观条件。很多技巧、框架、COT等等,在国产大模型上效果不佳。我这边,现实就是一轮对话,低消耗token,快速解决具象问题,把业务链打通,拿下订单,才有可能继续获得投资人的青睐,公司才能继续活下去。我想,可能因为不少国内自研的大模型,是不是因为时日太短还是国内大模型RLHF做得不太好,与人类语义对齐这个效果很差。我也用过千帆、百川的开发者平台,在那个上面调过大量prompt,到最后,完完全全变成了我与ai语义对齐,根本就不是ai和人类对齐......当你的一个提示词调试了近百个版本,最后发现,是那个语义最不通顺,看起来最稀奇古怪、莫名其妙的prompt效果最好的时候,内心有多么崩溃么!这个过程你会见到大量模型幻觉和抽疯的回答,用一个词来形容,那就是“抽象”,真的太抽象了。智谱啊,你到底深度学习了什么哇!
详情参见刘海[23.08] 网上疯传的「AI 提示词工程师」到底是什么?中对BOSS上大量提示词工程师的JD分析。真要我说的话,每家公司的业务不同,标准不同,其实没有什么硬性的考核标准,准确度这个东西是由人根据实际业务制定的。这是个经验活,是个技巧活,得大量试错,大量测试,最后总结出一些规律。然后再实践,再总结。最后突然有一天,模型部的同学告诉你咱家模型升级啦!快去测测!然后你惊奇的发现,那些规律有50%又失效了。
尽早在AI工具上实现一万小时的积累,天天玩、天天耍,什么千帆、百川、minmax各家开发者平台都去用用,就当是竞品分析了。这波大模型是生成式AI,不是过去的判别式AI,这是有本质区别的,业务上接触到的很多人还在用过去的单个小模型算法去看待这波AI技术,这个肯定是比较片面的。你要去锤炼自己的语言逻辑(逻辑清晰才能表述清楚任务),增加自己的世界知识(各行各业)和大模型知识,最后,扎根业务,多去一线跑。有项目才有未来。
LangGPT社区是我见过的最棒的开源提示词社区!一直很感谢云中江树、盘盘、梁思姐、杜昕等大佬对我的支持和鼓励!在提示词这方面,我觉得已经做的非常好了,唯一缺点就是更新的很慢,最近只有活动......咱也理解,毕竟江树好像去当小桔子了,肯定天天加班!(过去俺也是桔厂一员)在成为提示词工程师前的知识点已经非常充足,好,那么成为提示词工程师之后呢?打怪升级的路径是什么,有哪些技能点需要点,转职当什么职业,这方面的东西很少。目前看到比较多的职业规划路径是AI产品,但是网上和AI产品经理相关的优质社区好少啊!或者说有什么别的转职路径吗?嗯,所以希望社区增加,成为Prompt工程师以后的晋级规划模块!总结
2023年是AI元年,2023年以前是信息时代,2023年以后是智能时代,我很庆幸自己在加入了一家诞生于AI元年的大模型公司。随着我和数据接触的越来越多,我感觉到中国一个非常明显的优势是应用场景多,数据多。有些场景是可以形成数据飞轮的。在行业先发,会有很大优势。未来大模型一定会无处不在,你有多大见解,就有多大价值,谁拥有议题,谁就拥有未来。嗯,与大模型对齐也挺好