微信扫码
与创始人交个朋友
我要投稿
HuggingFace团队24小时极限挑战,复刻OpenAI Deep Research,开源AI工具生态迎来新变革!核心内容:1. HuggingFace闪电速度复刻OpenAI Deep Research,开源智能体性能亮眼2. 项目从立项到发布仅用24小时,极限开发全流程揭秘3. 完全开源,内核使用CodeAgent,支持多种文件格式解析和跨会话记忆
嘿,大家好!这里是一个专注于AI智能体的频道~
24 小时极限开发的 Agent 能跑多快?
昨天凌晨,HuggingFace 又一次扔下重磅炸弹——宣布开源名为「Open Deep Research」的自主研究智能体。
直接对标 OpenAI 闭源 Deep Research,这个从立项到发布仅用 24 小时的项目,正在用开源社区的闪电速度改写 AI 工具生态。
故事要从 OpenAI 前天发布的 Deep Research 说起(能自动爬取全网信息、生成研究报告的智能体)。很强,但每月 200 美元的订阅费与闭源模式门槛也不低。
HuggingFace 实验室的科学家们直接拍板:「24 小时内,我们要用开源复刻这个产品!」
这个疯狂的计划最终演变成:
在GAIA基准测试中,获得了非常优异的成绩!
项目完全开源,代码地址:
https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research
内核使用他们自家的CodeAgent,相比于输出一堆的json,用代码对模型来说更顺畅,之前写过这个框架的教程,可以再公众号首页标签中找到。
第一个版本,使用纯文本浏览器,绕开渲染开销 ,页面元素自动转 Markdown 格式 。
使用一个解析器自动读取文本,支持 PDF/CSV/JSON 自动转换, 数学引擎能处理复杂公式推导 。
记忆模块保留跨会话上下文。
模型使用o1,为什么不用o3-mini?
官方回应: 它真的很快,但性能不如 o1 和 gpt-4o。我觉得模型太小了,对于困难任务还不够。
试过用 Deepseek R1 做这个吗?
官方回应: 试过,但没有 o1 那么好。这不是像许多 LLM 那样能力不行的问题,更多的是缺乏对框架指南的适应。所以我们正在考虑微调来解决这个!
最后,官方博客中提到:「o1 模型的 API 调用费已超过实验室咖啡预算,但我们需要证明开源框架的上限」。
比起 OpenAI 的「黑箱魔术」,开源智能体正在打开另一种可能:
项目发布后,立马有开发者用 Rust 重写了核心模块,将响应速度提升 3 倍;另一位贡献者则接入了 Wolfram Alpha,赋予其符号计算能力。这种「众人拾柴」的生态,或许正是超越闭源巨头的关键变量。
此刻,Hugging Face 的 GitHub 仓库仍在疯狂刷新提交记录。当我们问及「24 小时开发是否太冒险」时,项目负责人回复了一条 commit message:
git commit -m "冒险是开源者的勋章,而社区是我们的时光机"
好了,这就是我今天想分享的内容。如果你对构建AI智能体感兴趣,别忘了点赞、关注噢~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-05
一文纵览DeepSeek模型家族:从LLM到R1
2025-02-05
从0-1:DeepSeek 大模型本地部署全攻略
2025-02-05
使用腾讯 HAI 5 分钟内部署一个私人定制的 DeepSeek
2025-02-05
DeepSeek的「深度思考模式」
2025-02-05
Ollama + Open WebUI 部署自己的本地大语言模型知识库, 创建自定义 Ollama 模型.
2025-02-05
【AI工作流】Ollama本地化大模型安装
2025-02-05
【AI工作流】【喂饭】Xinference后台大模型平台搭建
2025-02-04
DeepSeek-R1 是怎么训练的|深度拆解
2025-01-01
2024-07-25
2024-05-06
2025-01-21
2024-08-13
2024-06-12
2024-09-20
2024-07-11
2024-07-20
2024-12-26
2025-01-22
2025-01-16
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13