我要投稿

加入AI公司三个月，我都做了些什么？——与大模型对齐的人类工程师

发布日期：2024-06-03 12:58:50 浏览次数： 2149 作者：wanwan的奇妙笔记

前言

本文主要内容为提示词工程师的工作实际经验和感悟。

详人所略，略人所详。

Prompt领域的优秀教程越来越多，基础知识可以参见社区先辈刘海同学：[23.08] 网上疯传的「AI 提示词工程师」到底是什么？

（这篇写得实在是好，我想不出任何不推荐的理由，提示词工程师必读好吧！刘海先辈受我一拜！）

大量的使用技巧，案例在LangGPT社区里也数不胜数，此处不赘。以下为正文

问：加入AI大模型公司三个月，你都做了些什么？

答：我在反复与大模型对齐......

问：最大的感触是什么？

答：抽象。

与大模型对齐的人类工程师

作为Prompt工程师就职，已经有三个月了，我的主要工作内容如下

售前技术支持

大模型公司还是要接单子的嘛，我在的公司目前还是一家创业公司，人员有限，每个人都得当多面手。

销售出去见客户的时候，很多技术问题细节回答不了，这个时候就由我出场了。勉强算是个技术人员，这几个月跟着销售面见了大量的客户，去了很多业务现场，积累的不少实际的业务经验，本身对你写prompt也是有帮助的，你只有知道了客户是在什么样的场景下去用你的大模型，现场是解决什么问题，你才能更好的去调整prompt，Know why才能Know how。

现在都是业务强导向，售前的这个活我也挺乐意干的，和客户现场交流的时候也需要捕捉他们的需求，另外也需要你为客户展示模型能力，现场根据客户的需求编写prompt，简单验证下场景。去帮助客户去梳理大模型的技术能够在他们的业务链条里怎么接入，解决什么问题，提升多少效率。有点AI落地解决方案的意思在。

emmm这几个月算是写了不少技术方案，锻炼了产品能力？

我还挺喜欢跟着销售大哥到处跑的。未来AI肯定会慢慢改造所有行业，现在能直接去行业一线，去了解早期AI时代大模型是怎么被打磨成一款产品打包应用出去的。这是非常宝贵的经验。

这部分工作我主要归结为售前技术支持，需要你懂一些技术原理。prompt工程师你不可能和算法、和研发去比代码能力，那么体现价值的地方就是你比研发懂业务，同时比销售和交付更懂自家大模型。

数据产出

上面讲到我会直面客户现场，和客户有很多沟通交流。交流最重点的一部分，就是得了解客户手上有什么样的数据，有多少量的数据，哪些数据是可以处理，然后拿去给大模型训练或者微调用的，哪些是价值不大的数据。

这会涉及到不少跨部门合作，你需要和算法同学商定这批数据怎么处理，标注哪些内容；决定好怎么处理数据后，就得开始布置上数据挖掘方案，和标注的同学一起确保数据产出的质量。因为有时候数据是海量的，我们又缺人，所以我也经常和标注同学一起去处理数据+质检......

有多少智能就有多少人工，虽然大模型本身已经预训练完成了，但是根据特定场景或者行业垂直场景需求，依然有大量数据需要人工去处理。作为prompt工程师，也得清楚微调的全部流程，微调前期最重要的工作就是数据的处理，你知道这个特定任务的数据是哪些，你才能更好的去调试prompt，去找prompt的编写技巧。

Prompt设计

有了以上两个环节后，其实才进入到具体的Prompt设计环节，这个时候你已经比较清楚业务需求+数据样本了，那么你以为prompt就很好编写了吗？

错！大错特错！

我知道现在有大量优秀的prompt框架，社区里很多大佬极其牛逼的提示词，用在ChatGPT4.0里，效果华丽，近乎炫技般。

但是国产大模型和ChatGPT真的不是一个东西，而且会极大的受限于客观条件。

很多技巧、框架、COT等等，在国产大模型上效果不佳。我这边，现实就是一轮对话，低消耗token，快速解决具象问题，把业务链打通，拿下订单，才有可能继续获得投资人的青睐，公司才能继续活下去。

我想，可能因为不少国内自研的大模型，是不是因为时日太短还是国内大模型RLHF做得不太好，与人类语义对齐这个效果很差。

我也用过千帆、百川的开发者平台，在那个上面调过大量prompt，到最后，完完全全变成了我与ai语义对齐，根本就不是ai和人类对齐......当你的一个提示词调试了近百个版本，最后发现，是那个语义最不通顺，看起来最稀奇古怪、莫名其妙的prompt效果最好的时候，内心有多么崩溃么！

这个过程你会见到大量模型幻觉和抽疯的回答，用一个词来形容，那就是“抽象”，真的太抽象了。

太棒了，我逐渐理解一切。

智谱啊，你到底深度学习了什么哇！

岗位要求和考核标准

详情参见刘海[23.08] 网上疯传的「AI 提示词工程师」到底是什么？中对BOSS上大量提示词工程师的JD分析。

真要我说的话，每家公司的业务不同，标准不同，其实没有什么硬性的考核标准，准确度这个东西是由人根据实际业务制定的。

这是个经验活，是个技巧活，得大量试错，大量测试，最后总结出一些规律。然后再实践，再总结。

最后突然有一天，模型部的同学告诉你咱家模型升级啦！快去测测！然后你惊奇的发现，那些规律有50%又失效了。

对想进来这个岗位的人提出个人意见

尽早在AI工具上实现一万小时的积累，天天玩、天天耍，什么千帆、百川、minmax各家开发者平台都去用用，就当是竞品分析了。

这波大模型是生成式AI，不是过去的判别式AI，这是有本质区别的，业务上接触到的很多人还在用过去的单个小模型算法去看待这波AI技术，这个肯定是比较片面的。

你要去锤炼自己的语言逻辑（逻辑清晰才能表述清楚任务），增加自己的世界知识（各行各业）和大模型知识，最后，扎根业务，多去一线跑。有项目才有未来。

希望社区未来做成什么样？

LangGPT社区是我见过的最棒的开源提示词社区！一直很感谢云中江树、盘盘、梁思姐、杜昕等大佬对我的支持和鼓励！

在提示词这方面，我觉得已经做的非常好了，唯一缺点就是更新的很慢，最近只有活动......咱也理解，毕竟江树好像去当小桔子了，肯定天天加班！（过去俺也是桔厂一员）

在成为提示词工程师前的知识点已经非常充足，好，那么成为提示词工程师之后呢？打怪升级的路径是什么，有哪些技能点需要点，转职当什么职业，这方面的东西很少。

目前看到比较多的职业规划路径是AI产品，但是网上和AI产品经理相关的优质社区好少啊！或者说有什么别的转职路径吗？

嗯，所以希望社区增加，成为Prompt工程师以后的晋级规划模块！

当然实际的工作经验分享也是越多越好！

总结

2023年是AI元年，2023年以前是信息时代，2023年以后是智能时代，我很庆幸自己在加入了一家诞生于AI元年的大模型公司。

随着我和数据接触的越来越多，我感觉到中国一个非常明显的优势是应用场景多，数据多。有些场景是可以形成数据飞轮的。在行业先发，会有很大优势。

未来大模型一定会无处不在，你有多大见解，就有多大价值，谁拥有议题，谁就拥有未来。

嗯，与大模型对齐也挺好

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

2025-04-25

医疗大模型案例分析（一）：Google Med-PaLM

2025-04-25

vLLM+Qwen-32B+Open Web UI构建本地私有大模型

2025-04-25

AI产品经理思考MCP（3）：MCP的未来可能

2025-04-25

AI产品经理思考MCP协议（2）：标准化的必要性

2025-04-25

AI产品经理思考MCP协议（1）：预见MCP——我的“万能库”与标准化之路

2025-04-24

温度参数：调节AI输出的确定性与创造性平衡

2025-04-24

从搜索到解决方案：解锁火山 DeepSearch 的“三连跳” MCP 玩法

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

从“大模型热”到“Agent 潮”，“真风口”还是“伪命题”？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB