微信扫码
与创始人交个朋友
我要投稿
今天我们将讨论一种创新的软件工具——微代理(Microagent)。我们已经见识过许多从文本到应用程序的软件,它们在生成代码方面表现得相当出色,但存在一个显著的问题:所生成的代码并不总是可靠的。所谓可靠性,是指代码在首次运行时是否能正确工作。这是大多数编码代理面临的一个重大问题。
举个例子,在使用某些编码代理(如aider)时,如果它生成了错误的代码,你需要不断与aider进行沟通,了解错误发生的原因。这种反复的过程非常麻烦,因为你无法依赖生成的代码,除非你亲自测试过它。
那么,如果我们使用的编码代理不仅能编写代码,还能为代码编写测试脚本、运行测试并检查其是否能正确工作呢?如果测试失败,代理还能自动修复代码。这正是Microagent所具备的功能。
Microagent是一种与传统编码代理方法不同的编码代理。通常,通用编码代理只生成代码,用户需要自己去检查代码是否有效。而Microagent首先生成代码,然后生成相应的测试脚本。接着运行测试,检查代码是否通过。如果代码通过测试,则任务成功;如果不通过,错误信息会反馈给代理,代理会修复代码。这一过程会递归进行,直到所有测试用例通过为止。
Microagent的理念是创建一个明确的测试用例,可以清晰地反馈代码是否按预期工作,并对代码进行迭代,直到所有测试用例通过。它支持OpenAI 、Claude,并允许更改OpenAI模型端点,这意味着也可以与Ollama和Groq一起使用。
安装Microagent非常简单,只需运行以下npm安装命令即可:
npm install -g @builder.io/micro-agent
安装完成后,可以使用microagent命令来使用它。但在此之前,我们需要先设置API密钥和模型。下面我将演示如何使用OpenAI进行设置。
设置OpenAI 首先,运行以下命令设置OpenAI的API密钥,然后,运行以下命令设置模型:
micro-agent config set OPENAI_KEY=<your token>
micro-agent config set MODEL=GPT-4o
完成这些设置后,你就可以开始使用微代理了。你可以导航到之前的项目目录或创建一个新目录。在新目录中使用微代理:
mkdir new_project_directory
cd new_project_directory
micro-agent
如果你在一个空目录中运行微代理,它会要求你创建一个Node项目。创建完成后,再次运行微代理命令:micro-agent
现在你可以使用它了。比如,我们可以让它生成一个简单的加法程序:
输入提示后,它会要求你为文件命名。如果你不想命名,微代理会自动生成一个名字。生成代码后,它会生成相应的测试脚本。然后运行测试,检查代码是否通过。
让我们来看一个实例。假设我们让微代理生成一个简单的加法程序,它会首先生成代码,然后生成测试脚本。完成后,它会询问你生成的测试是否正确。你可以发送确认提示:
然后它会运行测试,检查代码是否能通过。如果测试通过,任务就完成了。如果不通过,Microagent会反馈错误并修复代码,直到测试通过为止。
我们也可以用微代理创建一个实际应用。例如,我们可以创建一个Next.js应用并生成一个登录页面。首先,用以下命令创建一个Next.js应用:
npx create-next-app my-next-app
cd my-next-app
micro-agent
然后让微代理生成一个登录页面:
microagent会生成代码和测试脚本,并进行测试。如果测试失败,microagent会尝试修复代码。尽管如此,我们也发现了一些问题。如果AI生成的代码有缺陷,AI生成的测试脚本也可能有缺陷。如果测试脚本本身有问题,microagent可能会陷入一个循环,直到最终退出。这表明在某些复杂情况下,microagent可能并不完美。
我们也可以使用AMA来设置微代理。首先,访问Alama网站,下载并安装适用于你操作系统的软件。然后,选择Deep Seek Coder V2模型并安装:
Oalama install deep-seek-coder-v2
完成后,设置ollama API基地址指向本地主机和端口11434,然后设置模型
micro-agent config set OPENAI_API_ENDPOINT=http://localhost:11434
micro-agent config set MODEL=deepseek-coder-v2
完成这些设置后,你就可以使用microagent与ollama一起工作了。
总的来说,如果你通常进行功能编程并使用测试,microagent是一个不错的选择。它能够自动生成代码和测试脚本,并进行递归修复,直到所有测试通过。对于那些不使用测试的人来说,可能显得有些多余。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-22
XLNet+Milvus:比BERT还聪明的语义理解模型到底是怎么工作的?
2025-01-22
多活十年不是梦!OpenAI发布GPT-4b Micro模型
2025-01-22
全文版 | 豆包大模型 1.5 Pro 正式发布
2025-01-22
LalaEval:面向领域大模型的端到端人工评测框架
2025-01-22
OpenAI重磅:全新自主Agent意外曝光!
2025-01-22
突发!OpenAI宣布“星际之门计划”:5000 亿美元构建未来 AI 基础设施
2025-01-22
中国研究者破解OpenAI 01和03的“思考”秘密,AGI时代即将到来?
2025-01-22
Cohere Design: 顶尖 AI 团队的绝佳审美
2024-08-13
2024-05-28
2024-08-21
2024-04-26
2024-06-13
2024-09-23
2024-08-04
2024-07-09
2024-07-01
2024-07-18
2025-01-22
2025-01-22
2025-01-21
2025-01-21
2025-01-18
2025-01-15
2025-01-13
2025-01-13