AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


加入AI公司三个月,我都做了些什么?——与大模型对齐的人类工程师
发布日期:2024-06-03 12:58:50 浏览次数: 1958 来源:wanwan的奇妙笔记


前言

本文主要内容为提示词工程师的工作实际经验和感悟。

详人所略,略人所详。

Prompt领域的优秀教程越来越多,基础知识可以参见社区先辈刘海同学:[23.08] 网上疯传的「AI 提示词工程师」到底是什么?

(这篇写得实在是好,我想不出任何不推荐的理由,提示词工程师必读好吧!刘海先辈受我一拜!)

大量的使用技巧,案例在LangGPT社区里也数不胜数,此处不赘。以下为正文





问:加入AI大模型公司三个月,你都做了些什么?
答:我在反复与大模型对齐......
问:最大的感触是什么?
答:抽象。

与大模型对齐的人类工程师

Prompt工程师就职,已经有三个月了,我的主要工作内容如下
  1. 售前技术支持
大模型公司还是要接单子的嘛,我在的公司目前还是一家创业公司,人员有限,每个人都得当多面手。
销售出去见客户的时候,很多技术问题细节回答不了,这个时候就由我出场了。勉强算是个技术人员,这几个月跟着销售面见了大量的客户,去了很多业务现场,积累的不少实际的业务经验,本身对你写prompt也是有帮助的,你只有知道了客户是在什么样的场景下去用你的大模型,现场是解决什么问题,你才能更好的去调整prompt,Know why才能Know how。
现在都是业务强导向,售前的这个活我也挺乐意干的,和客户现场交流的时候也需要捕捉他们的需求,另外也需要你为客户展示模型能力,现场根据客户的需求编写prompt,简单验证下场景。去帮助客户去梳理大模型的技术能够在他们的业务链条里怎么接入,解决什么问题,提升多少效率。有点AI落地解决方案的意思在。
emmm这几个月算是写了不少技术方案,锻炼了产品能力?
我还挺喜欢跟着销售大哥到处跑的。未来AI肯定会慢慢改造所有行业,现在能直接去行业一线,去了解早期AI时代大模型是怎么被打磨成一款产品打包应用出去的。这是非常宝贵的经验。
这部分工作我主要归结为售前技术支持,需要你懂一些技术原理。prompt工程师你不可能和算法、和研发去比代码能力,那么体现价值的地方就是你比研发懂业务,同时比销售和交付更懂自家大模型。
  1. 数据产出
上面讲到我会直面客户现场,和客户有很多沟通交流。交流最重点的一部分,就是得了解客户手上有什么样的数据,有多少量的数据,哪些数据是可以处理,然后拿去给大模型训练或者微调用的,哪些是价值不大的数据。
这会涉及到不少跨部门合作,你需要和算法同学商定这批数据怎么处理,标注哪些内容;决定好怎么处理数据后,就得开始布置上数据挖掘方案,和标注的同学一起确保数据产出的质量。因为有时候数据是海量的,我们又缺人,所以我也经常和标注同学一起去处理数据+质检......
有多少智能就有多少人工,虽然大模型本身已经预训练完成了,但是根据特定场景或者行业垂直场景需求,依然有大量数据需要人工去处理。作为prompt工程师,也得清楚微调的全部流程,微调前期最重要的工作就是数据的处理,你知道这个特定任务的数据是哪些,你才能更好的去调试prompt,去找prompt的编写技巧。
  1. Prompt设计
有了以上两个环节后,其实才进入到具体的Prompt设计环节,这个时候你已经比较清楚业务需求+数据样本了,那么你以为prompt就很好编写了吗?
错!大错特错!
我知道现在有大量优秀的prompt框架,社区里很多大佬极其牛逼的提示词,用在ChatGPT4.0里,效果华丽,近乎炫技般。
但是国产大模型和ChatGPT真的不是一个东西,而且会极大的受限于客观条件。
很多技巧、框架、COT等等,在国产大模型上效果不佳。我这边,现实就是一轮对话,低消耗token,快速解决具象问题,把业务链打通,拿下订单,才有可能继续获得投资人的青睐,公司才能继续活下去。
我想,可能因为不少国内自研的大模型,是不是因为时日太短还是国内大模型RLHF做得不太好,与人类语义对齐这个效果很差。
我也用过千帆、百川的开发者平台,在那个上面调过大量prompt,到最后,完完全全变成了我与ai语义对齐,根本就不是ai和人类对齐......当你的一个提示词调试了近百个版本,最后发现,是那个语义最不通顺,看起来最稀奇古怪、莫名其妙的prompt效果最好的时候,内心有多么崩溃么!
这个过程你会见到大量模型幻觉和抽疯的回答,用一个词来形容,那就是“抽象”,真的太抽象了。
太棒了,我逐渐理解一切。

智谱啊,你到底深度学习了什么哇!

  1. 岗位要求和考核标准
详情参见刘海[23.08] 网上疯传的「AI 提示词工程师」到底是什么?中对BOSS上大量提示词工程师的JD分析。
真要我说的话,每家公司的业务不同,标准不同,其实没有什么硬性的考核标准,准确度这个东西是由人根据实际业务制定的。
这是个经验活,是个技巧活,得大量试错,大量测试,最后总结出一些规律。然后再实践,再总结。
最后突然有一天,模型部的同学告诉你咱家模型升级啦!快去测测!然后你惊奇的发现,那些规律有50%又失效了。
  1. 对想进来这个岗位的人提出个人意见
尽早在AI工具上实现一万小时的积累,天天玩、天天耍,什么千帆、百川、minmax各家开发者平台都去用用,就当是竞品分析了。
这波大模型是生成式AI,不是过去的判别式AI,这是有本质区别的,业务上接触到的很多人还在用过去的单个小模型算法去看待这波AI技术,这个肯定是比较片面的。
你要去锤炼自己的语言逻辑(逻辑清晰才能表述清楚任务),增加自己的世界知识(各行各业)和大模型知识,最后,扎根业务,多去一线跑。有项目才有未来。
  1. 希望社区未来做成什么样?
LangGPT社区是我见过的最棒的开源提示词社区!一直很感谢云中江树、盘盘、梁思姐、杜昕等大佬对我的支持和鼓励!
在提示词这方面,我觉得已经做的非常好了,唯一缺点就是更新的很慢,最近只有活动......咱也理解,毕竟江树好像去当小桔子了,肯定天天加班!(过去俺也是桔厂一员)
在成为提示词工程师前的知识点已经非常充足,好,那么成为提示词工程师之后呢?打怪升级的路径是什么,有哪些技能点需要点,转职当什么职业,这方面的东西很少。
目前看到比较多的职业规划路径是AI产品,但是网上和AI产品经理相关的优质社区好少啊!或者说有什么别的转职路径吗?
嗯,所以希望社区增加,成为Prompt工程师以后的晋级规划模块!
当然实际的工作经验分享也是越多越好!

总结

2023年是AI元年,2023年以前是信息时代,2023年以后是智能时代,我很庆幸自己在加入了一家诞生于AI元年的大模型公司。
随着我和数据接触的越来越多,我感觉到中国一个非常明显的优势是应用场景多,数据多。有些场景是可以形成数据飞轮的。在行业先发,会有很大优势。
未来大模型一定会无处不在,你有多大见解,就有多大价值,谁拥有议题,谁就拥有未来。
嗯,与大模型对齐也挺好



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询