我要投稿

从零到一打造商用 AI Agent（智能体）

发布日期：2025-02-01 11:56:08 浏览次数： 3344 作者：我叫秋水

经常有朋友问我，如何打造一个商用 AI Agent（智能体）？

是选择 Coze？Dify？还是 LangGraph ？
过程中有哪些注意事项？
我的数据应该存储在哪里？
为什么某些网页用这个工具无法抓取到内容？
······

因此，在 2025 年初，我结合这两年的 AI Agent 的开发经验，启动了一个合集《从零到一打造 AI Agent》。

内容包含了 AI Agent 的理论、实操和案例，我将一步步展示如何打造一个商用 AI Agent 的完整过程。

如果你是非技术人员，这对你来说非常有帮助；如果你是技术人员，这个视频将帮助你少走一些弯路，快速上手！

全文 3900 字，可以先收藏。

关注我，及时收到后续内容。

这篇内容将从整体上介绍打造 AI Agent 的七个步骤，分别是需求梳理、软件选型、提示工程、数据库、构建 UI 界面、测试评估和部署发布。

梳理需求

梳理工作流

第一步，我们需要做的工作就是梳理需求。

首先，我们需要明确，做这个 AI Agent 是为了帮我们解决什么问题？

如果你是一位自媒体从业者，可能会希望做一个 AI Agent 来帮你处理一些重复性的工作，如找对标、找热点、做分析、写初稿等，这样你可以把精力集中在内容创作上；
如果你是一位贸易公司的老板，可能会希望做一个 AI Agent 来帮你汇集来自不同平台的订单，并在各个平台之间进行产品询价和价格比较。

记住，你需要重点梳理的是那些重复性的、机械化的、不需要太多思考的工作，越详细越好。

当然，你也可以借助 AI 工具，与它交流，形成初稿后，再进行补充。

你是一位工作流梳理专家，请帮我梳理<自媒体编辑>这个角色在日常工作中需要重复干的工作，并标记处哪些可以由 AI 来协助，哪些主要我来去做，先以表格的形式（工作内容/AI协助/人工来做）输出，我当认为表格的内容完整后，我回复“继续”，你再以mermaid流程图的形式输出，每个流程节点需要注明是否可由AI协助完成，流程图为横向。

用到哪些工具

梳理完需求后，我们需要根据梳理的工作流，罗列出需要用到的工具。

例如，采集数据需要网页抓取工具；发布文章，需要对接微信公众平台。

因此，工具的选型也非常重要。借助不同的工具，可以让 AI Agent 在不同的系统之间自动化地执行任务，从而减少人工操作。

AI Agent 选型

第二步，我们需要根据场景选择 AI Agent 开发平台，选择合适的大模型，并选用不同的工具来执行不同系统的操作。

选择哪个 AI Agent 平台

先说说 AI Agent 开发平台，Dify、Coze、FastGPT 等这么多无代码 Agent 开发平台，我们该选择哪个比较合适呢？

Coze 只能使用云端，不能在本地部署。
Dify 是完全开源的，没有限制，但在知识问答方面的能力较弱。
FastGPT 的使用有一定限制，但在知识回答方面的能力相对较强。

更高级的开发平台，如 LangGraph、CrewAI 等，可以让 AI 自我规划并执行任务，但是需要编写代码。

是否选择这些平台，取决于我们的具体需求，当然也可以混合使用。

这就要求我们深入了解每个开发平台的特点，它擅长什么、不擅长什么，存在哪些明显的缺陷。只有掌握了这些信息，才能根据我们的场景做出合适的选型。

选择哪个 LLM

再说说大模型的选择，现在有海外的 OpenAI、Claude、Gemini，也有国内的 Kimi、通义千问和近期爆火的 DeepSeek，还有一些开源模型如 LLaMA、Grok，也有像 Mistral 这样的小模型。

那么，基于你的 AI Agent 场景，在这么多模型中，最合适的应该选择哪个？

如果你没有隐私数据，最好的选择是 OpenAI 和 Claude，因为它们是头部大模型。如果你仅仅是做翻译、总结文章等任务，选择国内的大模型效果也差不多，当前 DeepSeek 的性价比很高。

选择哪个模型，需要根据你的具体使用场景，当然也可以考虑混合使用。这个时候，建议你深入了解不同模型的能力。

• 小模型和大模型有什么区别？
• 哪个模型的推理能力最强？
• 8K、32K 等同一个模型的不同大小有什么区别？
• 如果本地部署，什么样的配置能运行什么样的模型？这些模型的能力如何？
• 如果使用云端大模型，模型的计费单价是多少？
• 是否可以混合使用不同的模型？
• 企业隐私数据能否使用云端大模型？

这些问题，我会在后续的内容中会逐一讲解。

选择哪些工具

最后，就是工具选择。工具是一种能力，它可以是生成一张图片，也可以是到互联网上去搜索，甚至可以是与一个系统进行对接。

AI Agent 开发平台的能力仅仅是利用大模型的能力，因此，如果需要与外部系统进行交互，就需要用到工具。工具大致可以分为有 API 接口的和无 API 接口的两类。

有 API 接口的工具，对接起来就非常简单。在 Coze、Dify 等平台上，已经集成了许多工具，可以直接配置和使用。

而对于无 API 接口的工具，就需要通过 RPA（机器人流程自动化）来处理。简单来说，RPA 是一种可以通过控制浏览器来执行一系列操作的自动化工具。

提示工程

第三步，提示工程是 AI Agent 的核心，好的提示词能够大大提升大模型输出的准确性。

一个好的提示词能帮助 AI Agent 准确地理解任务，提高大模型的输出质量。
一个好的提示词可以减少 token 的消耗，降低成本。
一个好的提示词可以帮助 AI Agent 理解上下文，确保对话的连贯性。

因此，我们需要掌握如何编写有效的提示词。

• 什么是 CRISPE 框架？
• 什么是 BROKE 框架？
• 什么是 ICIO 框架？
• 什么是 CoT（思维链）？

我们还需要了解与大模型交互的规则，例如：

• 一篇长文分多次输出比一次性输出的质量更高。
• 使用不同的符号将不同信息分隔开，可以增强大模型的理解。
• 给出示例能帮助大模型快速理解你的要求。
• 对于复杂任务，将其拆解为若干步骤，引导大模型分步执行，效果更佳。
• 明确输出内容的限定，如字数、格式、风格、语言难度等。

ICIO 框架：

• Intruction（任务）：明确指出希望 AI 执行的具体任务，如“翻译一段文本”或“撰写一篇关于 AI 伦理的博客文章”。
• Context（背景）：提供任务的背景信息，帮助 AI 理解任务的上下文，例如，“这段文本是用于公司内部会议的开场白”。
• Input Data（输入数据）：指定 AI 需要处理的具体数据，如“请翻译以下句子：‘人工智能正在改变世界’”。
• Output Indicator（输出格式）：设定期望的输出格式和风格，例如，“请以正式的商务英语风格翻译”。

BROKE 框架：

• Background（背景）：例如，“你正在为一家初创科技公司撰写一篇关于其最新产品的新闻稿。”
• Role（角色）：指定 AI 作为“新闻稿撰写者”，以便它能够以专业的角度回答问题。
• Objectives（目标/任务）：给出任务描述，如“撰写一篇吸引人的新闻稿，突出产品的独特卖点。”
• Key Result（关键结果）：设定回答的关键结果，例如，“使用正式和专业的语言，包含产品的主要功能和市场定位。”
• Evolve（改进）：在 AI 给出回答后，提供三种改进方法，如“调整语言风格以吸引目标受众”，“增加产品使用案例”，或“优化结构以提高阅读流畅性”。

CRISPE 框架：

1. Capacity and Role（角色）：明确 AI 在交互中应扮演的角色，如教育者、翻译者或顾问。
2. Insight（背景）：提供角色扮演的背景信息，帮助 AI 理解其在特定情境下的作用。
3. Statement（任务）：直接说明 AI 需要执行的任务，确保其理解并执行用户的请求。
4. Personality（格式）：设定 AI 回复的风格和格式，使其更符合用户的期望和场景需求。
5. Experiment（实验）：如果需要，可以要求 AI 提供多个示例，以供用户选择最佳回复。

CoT 框架：

Chain-of-Thought，一种引导大模型像人类一样，按照顺序一步步思考问题解决方案的方法。

主要包括 Few-Shot CoT 和 Zero-Shot CoT 两种应用方式。

Few-Shot CoT（少量示例）

描述思考步骤，先理解客户需求，再考虑<目标>，最后给出推荐并解释原因。

同时提供示例，这些示例展示 AI 如何依思维链思考给出答案。

Zero-Shot CoT（没有示例）

简单地增加一句提示词即可：

让我们一步步的思考（Let’s think step by step）

数据库选型

第四步，AI Agent 运行过程中产生的聊天记录、采集数据等内容存放到哪里？这个时候就需要数据库了。

对于非技术人员，我建议使用飞书的多维表格，因其可视化程度高、易于操作、对接简单。

不足之处是，当数据量变大时，读取速度会变慢，且无法处理复杂的业务逻辑。

而对于技术人员，可以使用 MySQL、NoSQL 等常用的数据库。

构建 UI 界面

第五步，构建属于你自己的 UI 界面。在 Coze 上，你可以 DIY 自己的界面，而在 Dify 上则有现成的界面，只是不能修改。

这两个平台也都可以发布成服务 API，也就是说，你可以不使用它们提供的界面，而是独立开发一个界面，与其对接。

如果你要开发自己的界面，可以借助 Cursor 这样的 AI 编程平台，来定制开发一个。

还有一个原因需要你自己开发一个界面，那就是在 Coze 和 Dify 上，你可以定义多个 AI Agent，你可以用自己定义的界面来调用，这样可以让你在使用时，始终在一个界面上操作。

测试评估

第六步，测试评估。测试是确保你的 AI Agent 不会出现错误，例如程序报错、大模型无法处理用户请求等问题。

评估则是确保 AI Agent 输出的回复是正确的。在评估的过程中，我们需要不断优化 AI Agent，确保它能够输出正确的回答，并减少 token 的消耗。

我们可以使用 LangSmith 来监控项目的运行。

LangSmith 帮助你更好地使用大模型：

• 调试和测试：它可以帮助你找出程序中的问题，并提供解决方案，确保 AI Agent 能够正确地回答问题或完成任务。
• 评估：通过创建各种测试案例，来测试 AI Agent 的表现，比如它回答问题的准确性和可靠性。
• 监控：它可以实时观察 AI Agent 的工作状态，比如处理请求的速度、花费的成本等。
• 日志记录：它可以记录 AI Agent 在工作过程中所有的详细信息，包括接收到的问题、给出的回答以及使用的参数等，方便你进行分析和改进。

部署发布

第七步，部署发布。不同的 AI Agent 开发平台有不同的部署方式。Coze 可以直接发布到豆包、小程序等平台上，而 Dify 则可以直接发布为 Web 应用，或者嵌入到你的系统当中。

如果你是独立开发的 AI Agent，那么你可以购买服务器进行独立部署。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业