微信扫码
添加专属顾问
我要投稿
在现代工业中,研发(R&D)对于提高工业生产力至关重要,尤其是在人工智能时代,研发的核心方面主要集中在数据和模型上。
RD Agent 旨在自动化这些高价值的通用研发流程,让AI驱动数据驱动的AI。
所以这个框架是的对于不是进行数据驱动的科研之外暂时没有太好的应用案例,但是其原理我们可以学习借鉴一下。
从方法论上讲,RD Agent 提出了一个由两个关键部分组成的自主代理框架:(R)esearch 代表通过提出新想法来积极探索,(D)开发代表实现这些想法。这两个组成部分的有效性最终会通过实践得到反馈,双方的研发能力都可以在过程中不断学习和成长。
上图显示了 RDAgent 的整体框架。
大致流程如下(注意两个专家角色的职责和交互):
这个基本的方法框架,不断提出假设、验证它们并从现实世界获得反馈。 这也是我们知道的第一个支持与实际验证链接的科研自动化框架。
对详细代码感兴趣的话,可以看看下面的工作流,展示了框架主要的类的交互:
还可以看看这个论文,了解更多的细节:
Co-STEER 是一种处理以数据为中心的开发 (AD2) 任务并突出其主要挑战的方法,这些挑战需要专家般的实施(即从实践中学习领域知识)和任务调度能力(例如,从更简单的任务开始以提高整体效率),这些领域在很大程度上被以前的工作所忽视。我们的 Co-STEER 代理通过我们不断发展的策略来增强其领域知识,并通过收集和使用特定领域的实践经验来提高其调度和实施技能。有了更好的时间表,实施就会变得更快。同时,随着实施反馈变得更加详细,调度准确性也会提高。这两项功能通过实际反馈共同发展,从而实现协作式发展过程。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-12
使用vLLM部署工具加速QWQ,推理速度比ollama更快、并发更高
2025-03-12
企业级私有化部署:基于 Ollama 实现 DeepSeek 大模型
2025-03-11
DeepSeek 满血版 8卡 H20 141GB 并发压力测试,体验极致性能!
2025-03-11
Cursor 新版本要来了!释放Claude 3.7全部潜力,估值百亿引热议,前Apple工程师:招人要会用AI。
2025-03-11
vLLM 私有化部署满血版 DeepSeek-R1-671B 模型
2025-03-11
从DeepSeek到Manus:如何实现本地LLM微调+联网开发?
2025-03-11
从零开始的DeepSeek微调训练实战(SFT)
2025-03-11
DeepSeek-R1 671B + KTransformer部署服务器配置&万元复现方案
2025-02-04
2025-02-04
2024-09-18
2024-07-11
2024-07-09
2024-07-11
2024-07-26
2025-02-05
2025-01-27
2025-02-01