微信扫码
与创始人交个朋友
我要投稿
打造商用AI Agent的全面指南,适合非技术人员和技术人员快速上手。核心内容:1. 打造商用AI Agent的七个步骤概览2. 如何梳理需求和工作流,明确AI Agent目标3. 实际案例:自媒体编辑工作流程的AI自动化梳理
Hi,大家好,我叫秋水,当前专注于 AI 智能体和 AI 工作流自动化
经常有朋友问我,如何打造一个商用 AI Agent(智能体)?
是选择 Coze?Dify?还是 LangGraph ?
过程中有哪些注意事项?
我的数据应该存储在哪里?
为什么某些网页用这个工具无法抓取到内容?
······
因此,在 2025 年初,我结合这两年的 AI Agent 的开发经验,启动了一个合集《从零到一打造 AI Agent》。
内容包含了 AI Agent 的理论、实操和案例,我将一步步展示如何打造一个商用 AI Agent 的完整过程。
如果你是非技术人员,这对你来说非常有帮助;如果你是技术人员,这个视频将帮助你少走一些弯路,快速上手!
全文 3900 字,可以先收藏。
关注我,及时收到后续内容。
这篇内容将从整体上介绍打造 AI Agent 的七个步骤,分别是需求梳理、软件选型、提示工程、数据库、构建 UI 界面、测试评估和部署发布。
第一步,我们需要做的工作就是梳理需求。
首先,我们需要明确,做这个 AI Agent 是为了帮我们解决什么问题?
如果你是一位自媒体从业者,可能会希望做一个 AI Agent 来帮你处理一些重复性的工作,如找对标、找热点、做分析、写初稿等,这样你可以把精力集中在内容创作上;
如果你是一位贸易公司的老板,可能会希望做一个 AI Agent 来帮你汇集来自不同平台的订单,并在各个平台之间进行产品询价和价格比较。
记住,你需要重点梳理的是那些重复性的、机械化的、不需要太多思考的工作,越详细越好。
当然,你也可以借助 AI 工具,与它交流,形成初稿后,再进行补充。
你是一位工作流梳理专家,请帮我梳理<自媒体编辑>这个角色在日常工作中需要重复干的工作,并标记处哪些可以由 AI 来协助,哪些主要我来去做,先以表格的形式(工作内容/AI协助/人工来做)输出,我当认为表格的内容完整后,我回复“继续”,你再以mermaid流程图的形式输出,每个流程节点需要注明是否可由AI协助完成,流程图为横向。
梳理完需求后,我们需要根据梳理的工作流,罗列出需要用到的工具。
例如,采集数据需要网页抓取工具;发布文章,需要对接微信公众平台。
因此,工具的选型也非常重要。借助不同的工具,可以让 AI Agent 在不同的系统之间自动化地执行任务,从而减少人工操作。
第二步,我们需要根据场景选择 AI Agent 开发平台,选择合适的大模型,并选用不同的工具来执行不同系统的操作。
先说说 AI Agent 开发平台,Dify、Coze、FastGPT 等这么多无代码 Agent 开发平台,我们该选择哪个比较合适呢?
Coze 只能使用云端,不能在本地部署。
Dify 是完全开源的,没有限制,但在知识问答方面的能力较弱。
FastGPT 的使用有一定限制,但在知识回答方面的能力相对较强。
更高级的开发平台,如 LangGraph、CrewAI 等,可以让 AI 自我规划并执行任务,但是需要编写代码。
是否选择这些平台,取决于我们的具体需求,当然也可以混合使用。
这就要求我们深入了解每个开发平台的特点,它擅长什么、不擅长什么,存在哪些明显的缺陷。只有掌握了这些信息,才能根据我们的场景做出合适的选型。
再说说大模型的选择,现在有海外的 OpenAI、Claude、Gemini,也有国内的 Kimi、通义千问和近期爆火的 DeepSeek,还有一些开源模型如 LLaMA、Grok,也有像 Mistral 这样的小模型。
如果你没有隐私数据,最好的选择是 OpenAI 和 Claude,因为它们是头部大模型。如果你仅仅是做翻译、总结文章等任务,选择国内的大模型效果也差不多,当前 DeepSeek 的性价比很高。
选择哪个模型,需要根据你的具体使用场景,当然也可以考虑混合使用。这个时候,建议你深入了解不同模型的能力。
这些问题,我会在后续的内容中会逐一讲解。
最后,就是工具选择。工具是一种能力,它可以是生成一张图片,也可以是到互联网上去搜索,甚至可以是与一个系统进行对接。
AI Agent 开发平台的能力仅仅是利用大模型的能力,因此,如果需要与外部系统进行交互,就需要用到工具。工具大致可以分为有 API 接口的和无 API 接口的两类。
有 API 接口的工具,对接起来就非常简单。在 Coze、Dify 等平台上,已经集成了许多工具,可以直接配置和使用。
而对于无 API 接口的工具,就需要通过 RPA(机器人流程自动化)来处理。简单来说,RPA 是一种可以通过控制浏览器来执行一系列操作的自动化工具。
第三步,提示工程是 AI Agent 的核心,好的提示词能够大大提升大模型输出的准确性。
一个好的提示词能帮助 AI Agent 准确地理解任务,提高大模型的输出质量。
一个好的提示词可以减少 token 的消耗,降低成本。
一个好的提示词可以帮助 AI Agent 理解上下文,确保对话的连贯性。
因此,我们需要掌握如何编写有效的提示词。
我们还需要了解与大模型交互的规则,例如:
ICIO 框架:
BROKE 框架:
CRISPE 框架:
CoT 框架:
Chain-of-Thought,一种引导大模型像人类一样,按照顺序一步步思考问题解决方案的方法。
主要包括 Few-Shot CoT 和 Zero-Shot CoT 两种应用方式。
Few-Shot CoT(少量示例)
描述思考步骤,先理解客户需求,再考虑<目标>,最后给出推荐并解释原因。
同时提供示例,这些示例展示 AI 如何依思维链思考给出答案。
Zero-Shot CoT(没有示例)
简单地增加一句提示词即可:
让我们一步步的思考(Let’s think step by step)
第四步,AI Agent 运行过程中产生的聊天记录、采集数据等内容存放到哪里?这个时候就需要数据库了。
对于非技术人员,我建议使用飞书的多维表格,因其可视化程度高、易于操作、对接简单。
不足之处是,当数据量变大时,读取速度会变慢,且无法处理复杂的业务逻辑。
而对于技术人员,可以使用 MySQL、NoSQL 等常用的数据库。
第五步,构建属于你自己的 UI 界面。在 Coze 上,你可以 DIY 自己的界面,而在 Dify 上则有现成的界面,只是不能修改。
这两个平台也都可以发布成服务 API,也就是说,你可以不使用它们提供的界面,而是独立开发一个界面,与其对接。
如果你要开发自己的界面,可以借助 Cursor 这样的 AI 编程平台,来定制开发一个。
还有一个原因需要你自己开发一个界面,那就是在 Coze 和 Dify 上,你可以定义多个 AI Agent,你可以用自己定义的界面来调用,这样可以让你在使用时,始终在一个界面上操作。
第六步,测试评估。测试是确保你的 AI Agent 不会出现错误,例如程序报错、大模型无法处理用户请求等问题。
评估则是确保 AI Agent 输出的回复是正确的。在评估的过程中,我们需要不断优化 AI Agent,确保它能够输出正确的回答,并减少 token 的消耗。
我们可以使用 LangSmith 来监控项目的运行。
LangSmith 帮助你更好地使用大模型:
第七步,部署发布。不同的 AI Agent 开发平台有不同的部署方式。Coze 可以直接发布到豆包、小程序等平台上,而 Dify 则可以直接发布为 Web 应用,或者嵌入到你的系统当中。
如果你是独立开发的 AI Agent,那么你可以购买服务器进行独立部署。
这就是我将在合集《从零到一打造 AI Agent》里介绍的一系列内容,非常开心与你一起深入研究这些内容,帮助你打造属于你自己的完美 AI Agent。
我相信你还有很多问题,后续的内容我们将一起深入研究和探讨。
如果你喜欢这个这篇文章,别忘了点赞、收藏和关注我,这样你就不会错过后续更详细的教程!
如果你有任何问题或想要探讨的内容,欢迎留言告诉我。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-04
2024-09-26
2024-10-30
2024-12-25
2024-10-30
2024-09-03
2024-09-06
2024-08-18
2024-11-23
2024-09-02