微信扫码
与创始人交个朋友
我要投稿
自动化机器学习(AutoML)旨在减少人为干预,自动设计可靠的机器学习解决方案。传统的AutoML框架依赖于预定义的搜索空间和固定流程,缺乏适应性,难以应对多样化和动态的数据场景,导致在复杂设置下性能不佳。尽管基于大型语言模型(LLM)的Agent显示出自动化机器学习任务的潜力,但它们在生成多样化和高度优化的代码方面存在不足,通常生成低多样性和次优代码,即使经过多次迭代优化。
本文提出了SELA(Tree-Search Enhanced LLM Agents),一种创新的基于Agent的系统,结合了蒙特卡罗树搜索(MCTS)和LLM Agent以优化AutoML过程。SELA将管道配置表示为树结构,使Agent能够智能地进行实验,并迭代优化其策略,从而更有效地探索机器学习解决空间。通过这种反馈驱动的过程,SELA能够基于实验反馈发现最佳路径,提高解决方案的整体质量。
下图是SELA的工作流程与其他Agent式AutoML框架的对比。
下图是SELA的整体管道运作流程
搜索空间表示:
计划生成过程:
MCTS中的UCT-DP选择函数:
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-26
新型LLM优化技术削减内存成本高达75%
2024-12-26
AI模型训练到底在训练什么?
2024-12-25
Cursor小白必看:听说你还在安装配置环境?学会这个让你告别环境烦恼!
2024-12-25
微软变脸OpenAI,模型价值之争压不住了?
2024-12-25
GPT-5 研发一年半进度堪忧!每轮 5 亿美金训练成本打水漂,还得雇人从头“造数据”
2024-12-25
基于昇腾910B,使用XTuner微调一个InternLM个人小助手丨玩转书生大模型
2024-12-25
BERT新版本:ModernBERT -- Smarter, Better, Faster, Longer
2024-12-25
Cursor 0.44 重磅更新:全面提升 Agent 能力
2024-09-18
2024-07-11
2024-07-11
2024-07-09
2024-06-11
2024-10-20
2024-07-26
2024-07-23
2024-07-20
2024-07-12