支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


开源力量:四个平替 OpenAI Deep Research AI Agent 的强大工具,搭配Deepseek真香

发布日期:2025-02-20 06:03:09 浏览次数: 2365 作者:觉察流
推荐语

开源AI工具的性价比之选,助你高效实现Deep Research。

核心内容:
1. 四个开源AI Research Agent介绍,平替OpenAI
2. 各工具的核心优势与应用场景解析
3. 如何结合Deepseek实现信息精准检索

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



 OpenAI 的 Deep Research AI Agent 价格昂贵,但开源社区提供了几个成本效益高且可定制的替代方案,本文将介绍这四个开源 AI Research Agent。


 

 



关联阅读

◆ AI Agent基础设施:解锁潜力与管理风险的关键

◆ 解锁 AI Agent 构建密码:六大开源框架解析

 AFLOW:用AI优化AI,开启高效工作流的新篇章

◆ 2025 年 13 门免费 AI Agent 课程资源

◆ 使用 PydanticAI 框架快速构建 Multi-Agent 系统 - AI Agent 协作触手可及

◆ Eko:用自然语言驱动前端开发,AI Agent 工作流新体验!

◆ 下一代AI Agent的"工具手":MCP如何让AI自主操作数据库/浏览器/API

◆ IntellAgent:对话式 AI 的评估框架

◆ AI的自我进化之路:Multi-Agent系统的自主迭代优化

◆ 从理论到现实:OpenAI 的 Operator 展示 CCA 的巨大潜力(Computer Control Agents)

◆ AI Agent 实战:用 LangGraph 实现持久化与流式传输

◆ Search-o1:动态检索 + 文档精炼,让 AI 推理解锁知识盲区

◆ DeepSeek 信息过载?- CHRONOS:AI 迭代自我问答,精准构建新闻时间线

◆ AI学会自我反思?Agent-R 使用蒙特卡洛树搜索(MCTS)自我训练自动纠错,让AI更聪明

◆ 为AI Agent设定边界:自然语言权限与结构化权限的结合 

◆ AI 落地的抉择:函数、多工具Agent还是Multi-Agent?

◆ Cline 3.3 新版本:编程界的 “安全卫士” 与 “效率先锋”

◆ Self-MoA:大道至简,聚焦单一模型打破传统MoA,简化LLM集成 

◆ 多智能体系统优化新突破:Mass 框架引领智能协作新思路


大家好,我是肆〇柒,OpenAI 的 Deep Research AI Agent 以其强大的研究辅助功能受到关注,但其每月 200 美元的高昂费用让许多人望而却步。幸运的是,开源社区为我们带来了几个优秀的替代方案。今天,我将为大家分享四个完全开源的 AI 研究Agent,它们在功能和性能上都能与 OpenAI 的产品相媲美。

1. Deep-Research

GitHub 仓库 

https://github.com/dzhng/deep-research

详细介绍 :

Deep-Research 是一个 AI 驱动的研究助手,能够对任何主题进行迭代式深度研究。它结合了搜索引擎、网页抓取和大型语言模型,通过动态生成搜索查询、提取网页内容和智能处理信息,为用户提供结构化的研究方法。该项目的目标是提供一个简洁的深度研究Agent实现,代码库行数控制在 500 行以内,便于理解和扩展。

关键特性 :

  • • 迭代研究 :通过迭代生成搜索查询、处理结果,并根据发现深入研究,逐步细化研究方向。
  • • 智能查询生成 :利用大型语言模型(LLM)根据研究目标和之前的发现生成有针对性的搜索查询。
  • • 深度和广度控制 :可配置参数,控制研究的广度(breadth)和深度(depth),以平衡研究的范围和深度。
  • • 智能跟进 :生成跟进问题,更好地理解研究需求,确保研究方向的准确性。
  • • 综合报告 :生成详细的 Markdown 报告,包含研究发现和来源,以清晰、可读的格式组织信息。
  • • 并发处理 :同时处理多个搜索和结果,提高研究效率,节省时间

使用方法(Quick Start) :

  1. 1. 克隆仓库和安装依赖项 :
git clone https://github.com/dzhng/deep-research.git
cd deep-research
npm install
  1. 2. 设置环境变量 :创建一个 .env.local 文件,并设置以下环境变量:
FIRECRAWL_KEY="your_firecrawl_key"
OPENAI_KEY="your_openai_key"

如果你使用本地 LLM,可以注释掉 OPENAI_KEY,并取消注释以下行:

OPENAI_ENDPOINT="http://localhost:1234/v1"
OPENAI_MODEL="your_model_name"
  1. 3. 运行研究助手 :
npm run dev

系统将提示你输入研究查询、指定研究广度(推荐:3-10,默认:4)和深度(推荐:1-5,默认:2),并回答跟进问题以细化研究方向。然后,系统将执行搜索查询、处理和分析结果、递归探索,并生成一个详细的 Markdown 报告,保存在工作目录下的 output.md 文件中。

2. OpenDeepResearcher

GitHub 仓库 

https://github.com/mshumer/OpenDeepResearcher

详细介绍 :

OpenDeepResearcher 是一个异步的 AI 研究Agent,能够根据用户查询持续搜索信息,直到系统确信已收集到所有必要细节。它利用 SERPAPI 进行 Google 搜索,Jina 提取网页内容,以及 OpenRouter 与 LLM 交互,生成搜索查询、评估页面相关性和提取上下文。

关键特性 :

  • • 迭代研究循环 :系统不断优化搜索查询,直到不再需要进一步查询。
  • • 异步处理 :搜索、网页抓取、评估和上下文提取同时进行,提高速度和效率。
  • • 去重过滤 :在每一轮中聚合和去重链接,确保同一链接不会被重复处理。
  • • LLM 驱动的决策制定 :使用 LLM 生成新的搜索查询、决定页面有用性、提取相关信息,并生成最终综合报告。
  • • Gradio 界面 :提供功能性的用户界面,方便用户交互。

使用方法(Quick Start) :

  1. 1. 克隆或打开笔记本文件 :你可以下载笔记本文件或直接在 Google Colab 中打开。
  2. 2. 安装依赖项 :运行以下命令安装 nest_asyncio
pip install nest_asyncio
  1. 3. 配置 API 密钥 :在笔记本中,将 OPENROUTER_API_KEYSERPAPI_API_KEY 和 JINA_API_KEY 的占位符值替换为你的实际 API 密钥。
  2. 4. 运行笔记本单元格 :按顺序执行所有单元格。系统将提示你输入研究查询 / 主题和可选的最大迭代次数(默认为 10)。然后,系统将执行以下步骤:
  • • 初始查询和搜索生成 :使用 LLM 生成初始搜索查询。
  • • 异步搜索和提取 :同时执行 SERPAPI 搜索,聚合唯一链接,并并行处理每个链接以确定页面有用性和提取相关信息。
  • • 迭代优化 :分析聚合的上下文,确定是否需要进一步的搜索查询。如果需要,生成新的查询;否则,循环终止。
  • • 最终报告生成 :根据所有收集的上下文生成最终的综合报告,并在输出中打印。

3. Open Deep Research by Firecrawl

GitHub 仓库 

https://github.com/nickscamara/open-deep-research

详细介绍 :

Open Deep Research by Firecrawl 是一个开源的深度研究克隆项目,它使用 Firecrawl 的提取和搜索功能,结合推理模型,对网络数据进行深度研究。与 OpenAI 的 Deep Research 实验不同,该项目不使用微调版本的 o3 模型,而是允许用户选择任何 LLM。

关键特性 :

  • • Firecrawl 搜索和提取 :通过搜索实时向 AI 提供数据,并从多个网站提取结构化数据。
  • • Next.js 应用程序路由器 :提供高级路由,实现无缝导航和性能;使用 React Server Components(RSCs)和 Server Actions 实现服务器端渲染和提高性能。
  • • AI SDK :提供统一 API,用于生成文本、结构化对象和工具调用;支持 OpenAI、Anthropic、Cohere 等模型提供商。
  • • 数据持久化 :使用 Vercel Postgres(由 Neon 提供支持)保存聊天历史和用户数据;使用 Vercel Blob 实现高效的文件存储。
  • • 用户认证 :使用 NextAuth.js 实现简单且安全的认证。

使用方法(Quick Start) :

  1. 1. 克隆仓库 :
git clone https://github.com/nickscamara/open-deep-research.git
cd open-deep-research
  1. 2. 安装依赖项 :
npm install
  1. 3. 设置环境变量 :创建一个 .env.local 文件,并设置以下环境变量:
NEXTAUTH_SECRET=your_nextauth_secret
VERCEL_ENV=your_vercel_env
OPENAI_API_KEY=your_openai_api_key
REASONING_MODEL=your_reasoning_model
BYPASS_JSON_VALIDATION=true
  1. 4. 运行数据库迁移 
npm run migrate
  1. 5. 运行应用程序 
npm run dev

你的应用程序现在应该在 localhost:3000 上运行。

4. DeepResearch by Jina AI

GitHub 仓库 

https://github.com/jina-ai/node-DeepResearch

详细介绍 :

DeepResearch by Jina AI 是一个高级的 AI 研究助手,复制了 OpenAI 的Agent搜索、阅读和推理工作流程。它集成了多个搜索引擎(如 Gemini Flash、Brave 和 DuckDuckGo),并采用 AI 驱动的方法提取和总结相关信息。该项目专注于通过迭代过程找到正确的答案,而不是生成长篇文章。

关键特性 :

  • • 搜索集成 :使用多个搜索引擎获取多样化的搜索结果。
  • • AI 驱动的阅读 :使用 Jina Reader 高效提取和总结内容。
  • • 推理过程 :使用高级 AI 模型进行上下文理解。
  • • 100% 开源 :完全可定制和自托管。
  • • 官方 API :提供 DeepSearch API,兼容 OpenAI API 架构,方便集成。

使用方法(Quick Start) :

  1. 1. 克隆仓库和安装依赖项 :
git clone https://github.com/jina-ai/node-DeepResearch.git
cd node-DeepResearch
npm install
  1. 2. 设置环境变量 :
export GEMINI_API_KEY=your_gemini_api_key
export JINA_API_KEY=your_jina_api_key
  1. 3. 运行开发命令 :
npm run dev "your_query"

例如:

npm run dev "what is the latest blog post's title from jina ai?"

系统将执行搜索、阅读和推理过程,直到找到答案或超出令牌预算。最终答案将显示在控制台中。

总结一下下

以上四个开源 AI 研究代理项目为研究人员提供了强大的工具,帮助他们自动化和优化工作流程,同时避免了高昂的成本。每个项目都有其独特的功能和优势,用户可以根据自己的需求选择合适的工具。希望这些详细的介绍和使用方法能帮助大家更好地理解和应用这些项目。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询