我要投稿

抱抱脸24小时复刻Deep Research，一个团队完成一个OpenAI~

发布日期：2025-02-05 20:19:22 浏览次数： 1996 作者：探索AGI

24 小时极限开发的 Agent 能跑多快？

昨天凌晨，HuggingFace 又一次扔下重磅炸弹——宣布开源名为「Open Deep Research」的自主研究智能体。

直接对标 OpenAI 闭源 Deep Research，这个从立项到发布仅用 24 小时的项目，正在用开源社区的闪电速度改写 AI 工具生态。

开源特攻队的极限时速

故事要从 OpenAI 前天发布的 Deep Research 说起（能自动爬取全网信息、生成研究报告的智能体）。很强，但每月 200 美元的订阅费与闭源模式门槛也不低。

HuggingFace 实验室的科学家们直接拍板：「24 小时内，我们要用开源复刻这个产品！」

这个疯狂的计划最终演变成：

凌晨 2 点完成基础架构设计
早上 7 点接入 OpenAI 的 o1 模型
下午 3 点突破网页自主滚动技术
晚间 9 点实现文件动态解析模块

在GAIA基准测试中，获得了非常优异的成绩！

OpenAI的Deep Research：67.36%
抱抱脸开源版本：54%
普通GPT-4（无Agent）：7%

?️ 解剖这只「开源猎豹」

项目完全开源，代码地址：

https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research

内核使用他们自家的CodeAgent，相比于输出一堆的json，用代码对模型来说更顺畅，之前写过这个框架的教程，可以再公众号首页标签中找到。

第一个版本，使用纯文本浏览器，绕开渲染开销，页面元素自动转 Markdown 格式。

使用一个解析器自动读取文本，支持 PDF/CSV/JSON 自动转换，数学引擎能处理复杂公式推导。

记忆模块保留跨会话上下文。

模型使用o1，为什么不用o3-mini?

官方回应： 它真的很快，但性能不如 o1 和 gpt-4o。我觉得模型太小了，对于困难任务还不够。

试过用 Deepseek R1 做这个吗？

官方回应： 试过，但没有 o1 那么好。这不是像许多 LLM 那样能力不行的问题，更多的是缺乏对框架指南的适应。所以我们正在考虑微调来解决这个！

最后，官方博客中提到：「o1 模型的 API 调用费已超过实验室咖啡预算，但我们需要证明开源框架的上限」

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

Manus开源版本！无需邀请码，老金手把手教你咋用！

2025-04-25

78k star，像写 Markdown 一样画流程图，这个开源工具太牛了！

2025-04-25

MarkItDown MCP：一款好用的将文件和办公文档转换为Markdown的AI工具！

2025-04-24

AI+SQL客户端，这款开源神器让数据库管理像聊天一样简单！

2025-04-24

效率革命！GitHub爆火的开源神器MinerU：PDF、网页、电子书一键转Markdown

2025-04-24

Suna：构建你专属“通用智能体”的开源利器

2025-04-24

开源TTS领域迎来重磅新星！Dia-1.6B：超逼真对话生成，开源2天斩获6.5K Star！

2025-04-24

仅用3周时间，就打造出Manus开源平替！贡献源代码，免费用

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB