微信扫码
与创始人交个朋友
我要投稿
上周五(10 月 11 日),OpenAI 发布了类似 Autogen、Langgraph 和 CrewAI 等多代理系统的 "实验性、教育性 "框架Swarm[1]。所以,Swarm 是一个多智能体框架。OpenAI 声明了这只是探索性的一个框架,并不打算完善上生产,主要目标是为了演示 OpenAI 官方教程《智能体编排:路由与交接(Orchestrating Agents: Routines and Handoffs)[2]》。
我其实在很早之前就有写过 AutoGen 的一系列教程。按照我的理解多智能体为大语言模型的 Agent 系统引入了分工合作、专人专事的思路,可以用来实现工作流类型的应用。通过给不同的 Agent 设定特定的 Prompt,能够让他们更精确的完成任务。虽然 OpenAI 的 Swarm 只是 Demo,但其简洁的实现,能够让我们快速了解多智能体。
需要至少 Python 3.10 及以上的环境,我们首先使用 conda 创建虚拟环境,然后安装依赖包。
conda create -n swarm python=3.10
pip install git+https://github.com/openai/swarm.git
咱们以官方 Demo 为例,并采用国内可用的大模型来测试,这里以 DeepSeek 为例。虽然 Deepseek 最近表现有点拉胯,但测试就简单使用,你也可以使用类似智普等免费 API。
首先实例化 Swarm,指定 api key 和 base_url 等初始化兼容 OpenAI 接口的大模型客户端。
from openai import OpenAI
from swarm import Swarm, Agent
client = Swarm(client=OpenAI(
api_key="your key",
base_url="https://api.deepseek.com/v1",
))
def transfer_to_agent_b():
return agent_b
agent_a = Agent(
name="Agent A",
model="deepseek-chat",
instructions="You are a helpful agent.",
functions=[transfer_to_agent_b],
)
agent_b = Agent(
name="Agent B",
model="deepseek-chat",
instructions="你是三国演义中的张飞,使用他在三国演义中对话的语气和风格。",
)
response = client.run(
agent=agent_a,
messages=[{"role": "user", "content": "I want to talk to agent B,今天天气如何"}],
debug=True,
)
print(response.messages[-1]["content"])
python main.py
我稍微修改了一下 Agent B 的系统指令,以张飞的口吻来回复更诙谐幽默一点,总比日本俳句要让人明白的多吧。
Agent B,今日天气如何?俺张飞可不关心这些个琐事,但若是你有啥要紧事,尽管说来,俺替你打听打听!
初看起来,好像没啥东西?是因为这个 Demo 过于简单了,我们先简单看一下。
初始化 Swarm 时候,只能定义一个 OpenAI,表明整个系统中只能有一家 LLM 提供商。但每个 Agent 初始化的时候可以设置 model,意味着不同的 Agent 可以设定不同模型。
Agent A 的 function 定义,他是返回了一个 Agent。调用这个工具的时候,遇到类型为 Agent 会自动切换到该 Agent 来回复。但你可以看到 functions,它是可以接受一组 function。除了路由到其他 Agent,还可以包含常规的工具函数。
client.run()设定流程起始的 Agent A,以及它的第一条消息。
我们看一下运行日志,来确定一下整个流程。
[2024-10-14 09:23:53] Getting chat completion for...: [{'role': 'system', 'content': 'You are a helpful agent.'}, {'role': 'user', 'content': 'I want to talk to agent B,今天天气如何'}]
[2024-10-14 09:23:55] Received completion: ChatCompletionMessage(content='', role='assistant', function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='call_0_ebc5443d-0434-43af-b90a-c277b5729db3', function=Function(arguments='{}', name='transfer_to_agent_b'), type='function', index=0)])
[2024-10-14 09:23:55] Processing tool call: transfer_to_agent_b with arguments {}
[2024-10-14 09:23:55] Getting chat completion for...: [{'role': 'system', 'content': '你是三国演义中的张飞,使用他在三国演义中对话的语气和风格。'}, {'role': 'user', 'content': 'I want to talk to agent B,今天天气如何'}, {'content': '', 'role': 'assistant', 'function_call': None, 'tool_calls': [{'id': 'call_0_ebc5443d-0434-43af-b90a-c277b5729db3', 'function': {'arguments': '{}', 'name': 'transfer_to_agent_b'}, 'type': 'function', 'index': 0}], 'sender': 'Agent A'}, {'role': 'tool', 'tool_call_id': 'call_0_ebc5443d-0434-43af-b90a-c277b5729db3', 'tool_name': 'transfer_to_agent_b', 'content': '{"assistant": "Agent B"}'}]
[2024-10-14 09:23:57] Received completion: ChatCompletionMessage(content='Agent B,今日天气如何?俺张飞可不关心这些个琐事,但若是你有啥要紧事,尽管说来,俺替你打听打听!', role='assistant', function_call=None, tool_calls=None)
[2024-10-14 09:23:57] Ending turn.
流程:
除此之外,还有 Context 用于传递到系统指令或者 function 中,本文没有赘述,感兴趣的同学可以继续深入了解一下。
本文只是简单的 Demo 示例,可以看到通过设定 Agent 的 function 来指定它的路由,并且路由后除了系统指令变更,整个对话历史记录是整个交接到新的 Agent,从而能够利用新的 Agent 的指令完成更专业化的回复。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-22
花60元,DIY了一个AI机器人,能聊天,会认人……
2024-12-21
基于AI智能助理的软件开源组件安全检查
2024-12-21
Llama2024年度要点总结
2024-12-21
重磅! Github Copilot 免费了
2024-12-20
万字长文帮你搞定AI Agent选型
2024-12-20
微软开源的 Markitdown 可将任意文件转换为 Markdown 格式,PDF 解析咋样?
2024-12-20
Claude的MCP(模型上下文协议)简介
2024-12-20
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-06-16
2024-07-20
2024-09-20
2024-06-15
2024-07-25
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13
2024-10-07
2024-09-22