微信扫码
和创始人交个朋友
我要投稿
用于开发 AI Web 代理的大型行动模型框架。
https://github.com/lavague-ai/LaVague
Hi,这里是Aitrainee,欢迎阅读本期新文章。
LaVague,这是一个用于开发AI网页应用的框架,它现在有了一些很酷的新更新,比如可以构建一个能够根据你的简历PNG自动申请工作的代理,这太疯狂了。
以前它只能做一些简单的任务,但现在似乎变得更好了,不仅能够处理常规任务,还能处理复杂任务。
看看这个展示视频,它展示了这一点。在下面展示视频中,开发者构建了一个代理,能够使用LaVague的开源框架根据简历的PNG文件申请工作,这使得代理能够在不到40秒内读取简历并填写表格。
这种方式你可以批量申请大量工作,简历会自动填写这些要求。
高频论文检索超越 Gemini 和 ChatGPT
使用 LaVague 创建一个代理,寻找 HuggingFace Papers 上最新最热门论文:
我们将创建代理并通过 Gradio 界面为其提供服务。
可以在下面的演示中看到LaVague的代理如何能够超越 Gemini 和 ChatGPT 来回答查询 :
"What is the most trendy recent paper on text-to-video on Hugging Face papers? Provide the date and a summary of the paper" 。
LaVague 是一个很棒的工具,可以帮助你更有效地编写和维护自动化测试。手动编写测试脚本非常耗时。
LaVague 可以根据 Gherkin 编写的测试用例描述生成可重用的 pytest-bdd 代码。
除此以外,下面是 LaVague 如何采取多个步骤来实现“快速了解 PEFT”目标的示例:
代码更新了之后,你可以在Google Colab上访问并操作相关功能。
作为一个开源的大型动作模型框架,它被用于开发AI网页代理。
网页代理接收目标,比如打印Hugging Face Diffuser库的安装步骤,并能够执行所需的操作来实现这个目标。
LaVague利用两个核心组件,首先是世界模型,它接收目标和当前状态(即当前网页),并将其转化为指令。
其次是动作引擎,它将这些指令编译成动作代码,并利用Playwright和Selenium来执行这些代码。
那么如何开始呢?你只需用pip安装命令安装它,只需将其复制粘贴到命令提示符中。
之后你需要构建一个代理,并使用这里指定的目标实现它。
在他们的文档中有详细说明,他们进一步展示了如何自定义不同类型的内容,如何与不同的大型语言模型、不同类型的插件及其他第三方集成合作。
所以一定要看看快速指南及其自定义文档,这将为你提供更详细的安装过程和不同教程的展示。
https://docs.lavague.ai/
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-21
我是如何基于 DeepSeek-R1 构建出高效学习Agent的?
2025-02-20
如何编写适合自己的 Cursor Rules
2025-02-19
告别链式思考:新一代 AI 推理模型的提示词设计革命
2025-02-19
如何为DeepSeek这类推理模型编写Prompt
2025-02-18
推理框架对比:ReAct、思维链(COT)和思维树(TOT)谁更胜一筹
2025-02-15
DeepSeek提示词工程完全指南:如何用「思维翻译器」激发大模型潜能——附官方提示词和优化案例
2025-02-15
说说Kimi探索版的深度搜索和o1
2025-02-09
普通人的 GPT 时刻!Deepseek R1 让每个人都学会了麦肯锡式思考
2024-08-20
2024-06-29
2023-06-08
2024-09-17
2024-06-27
2024-07-09
2024-07-12
2024-06-14
2024-06-26
2024-09-16
2025-02-21
2025-01-05
2025-01-04
2024-12-15
2024-11-15
2024-11-01
2024-10-29
2024-09-11