我要投稿

聊聊上海人工智能实验室开源的轻量级agent框架——lagent

发布日期：2024-08-06 08:05:23 浏览次数： 2217 作者：阿郎小哥的随笔驿站

概述

官方仓库：lagent^[1]。

Lagent 是一个轻量级、开源的基于大语言模型的智能体（agent）框架，支持用户快速地将一个大语言模型转变为多种类型的智能体，并提供了一些典型工具为大语言模型赋能。它的整个框架图如下:

特性

流式输出：提供 stream_chat 接口作流式输出，本地就能演示酷炫的流式 Demo。
接口统一，设计全面升级，提升拓展性，包括

Model : 不论是 OpenAI API, Transformers 还是推理加速框架 LMDeploy 一网打尽，模型切换可以游刃有余；
Action: 简单的继承和装饰，即可打造自己个人的工具集，不论 InternLM 还是 GPT 均可适配；
Agent：与 Model 的输入接口保持一致，模型到智能体的蜕变只需一步，便捷各种 agent 的探索实现；

文档全面升级，API 文档全覆盖。

Agent类型

目前，官方的提供了四个agent。分别是：

autogpt.py
internlm2_agent.py
react.py
rewoo.py

其功能的用处，从其prompt即可识别出来。以internlm2_agent.py的prompt为例：

API_PREFIX = (
    "This is the subfunction for tool '{tool_name}', you can use this tool. "
    'The description of this function is: \n{description}')

META_CN = ('当开启工具以及代码时，根据需求选择合适的工具进行调用')

INTERPRETER_CN = ('你现在已经能够在一个有状态的 Jupyter 笔记本环境中运行 Python 代码。'
                  '当你向 python 发送含有 Python 代码的消息时，它将在该环境中执行。'
                  '这个工具适用于多种场景，如数据分析或处理（包括数据操作、统计分析、图表绘制），'
                  '复杂的计算问题（解决数学和物理难题），编程示例（理解编程概念或特性），'
                  '文本处理和分析（比如文本解析和自然语言处理），'
                  '机器学习和数据科学（用于展示模型训练和数据可视化），'
                  '以及文件操作和数据导入（处理CSV、JSON等格式的文件）。')

PLUGIN_CN = ('你可以使用如下工具：'
             '\n{prompt}\n'
             '如果你已经获得足够信息，请直接给出答案. 避免不必要的工具调用! '
             '同时注意你可以使用的工具，不要随意捏造！')

该agent主要用于数据分析，并且提供了tools检索arxiv。

internlm2_agent

官方的示例是提供了一个标准的agent实现，我个人觉得是蛮标准的，尤其是action与prompt的设计。

部署起来的界面如下：

该示例demo来自官方代码的examples/internlm2_agent_web_demo.py。

ArxivSearch在源码的actions文件中定义并实现了，其对应是agent中的action。参考该源码，我们可以实现自己的agent action。

ReAct

官方原先是放了一个react_web_demo.py，但现在删了；不过我额外找了个基于Llama3微调并实现了React agent的demo，见：llama3 react^[2]。

根据提交记录，重新找到了该react代码，主要是我想借鉴下原先的方式，代码地址：react_webdemo^[3]。感兴趣可以玩起来。

分析下ReAct代码：prompt的设计还是比较简略，对于自己的业务的话还是需要改造下，尤其是对于工具的调用。

Agent设计

lagent是一个轻量级的agent框架，其实现依靠与三个主要的抽象：

action_executor：action执行器，用于执行tools
protocol：prompt的设计与llm response的解析
BaseModel：LLM 模型

而集成自BaseAgent的各个Agent都会实现如上三个抽象类，即可完成自己的agent。在agent中实现流式调用输出，甚至是批量推理都是可以的，而且也有参考的agent实现。

官方代码中的四个agent还是很有参考价值的。整个的设计简洁又高效，相比较别的agent框架，的确是要更轻量级，非常方便入门学习以及了解LLM的很多基础知识。

总结

lagent是一个轻量级很方便学习入门agent范式的框架，我自己也花了一天的时间部署试玩调试，感觉还是蛮不错的一个框架。当然对于要完成实际业务的agent，尤其是需要切合我们自己的业务的话，还是需要重新设计agent，但官方的实现是很好的参考，很方便借鉴的实现。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-21

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

82.9K star！全平台AI助手神器，一键部署轻松搞定！

2025-04-21

微软又整活！MarkItDown-MCP：网页/文件一键转Markdown，还能直接喂给AI用！（支持Claude)

2025-04-21

清华大学未来实验室：开源多智能体协作框架！

2025-04-20

谷歌Agent2Agent协议：AI协作的新曙光

2025-04-19

DeepSeek+Dify 构建本地知识库，真香！

2025-04-19

微软开源实时交互模型：提升Agent动态复杂处理能力

2025-04-19

微软最新 Playwright MCP 服务器强势来袭？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部