微信扫码
与创始人交个朋友
我要投稿
今天我们将讨论一种创新的软件工具——微代理(Microagent)。我们已经见识过许多从文本到应用程序的软件,它们在生成代码方面表现得相当出色,但存在一个显著的问题:所生成的代码并不总是可靠的。所谓可靠性,是指代码在首次运行时是否能正确工作。这是大多数编码代理面临的一个重大问题。
举个例子,在使用某些编码代理(如aider)时,如果它生成了错误的代码,你需要不断与aider进行沟通,了解错误发生的原因。这种反复的过程非常麻烦,因为你无法依赖生成的代码,除非你亲自测试过它。
那么,如果我们使用的编码代理不仅能编写代码,还能为代码编写测试脚本、运行测试并检查其是否能正确工作呢?如果测试失败,代理还能自动修复代码。这正是Microagent所具备的功能。
Microagent是一种与传统编码代理方法不同的编码代理。通常,通用编码代理只生成代码,用户需要自己去检查代码是否有效。而Microagent首先生成代码,然后生成相应的测试脚本。接着运行测试,检查代码是否通过。如果代码通过测试,则任务成功;如果不通过,错误信息会反馈给代理,代理会修复代码。这一过程会递归进行,直到所有测试用例通过为止。
Microagent的理念是创建一个明确的测试用例,可以清晰地反馈代码是否按预期工作,并对代码进行迭代,直到所有测试用例通过。它支持OpenAI 、Claude,并允许更改OpenAI模型端点,这意味着也可以与Ollama和Groq一起使用。
安装Microagent非常简单,只需运行以下npm安装命令即可:
npm install -g @builder.io/micro-agent
安装完成后,可以使用microagent命令来使用它。但在此之前,我们需要先设置API密钥和模型。下面我将演示如何使用OpenAI进行设置。
设置OpenAI 首先,运行以下命令设置OpenAI的API密钥,然后,运行以下命令设置模型:
micro-agent config set OPENAI_KEY=<your token>
micro-agent config set MODEL=GPT-4o
完成这些设置后,你就可以开始使用微代理了。你可以导航到之前的项目目录或创建一个新目录。在新目录中使用微代理:
mkdir new_project_directory
cd new_project_directory
micro-agent
如果你在一个空目录中运行微代理,它会要求你创建一个Node项目。创建完成后,再次运行微代理命令:micro-agent
现在你可以使用它了。比如,我们可以让它生成一个简单的加法程序:
输入提示后,它会要求你为文件命名。如果你不想命名,微代理会自动生成一个名字。生成代码后,它会生成相应的测试脚本。然后运行测试,检查代码是否通过。
让我们来看一个实例。假设我们让微代理生成一个简单的加法程序,它会首先生成代码,然后生成测试脚本。完成后,它会询问你生成的测试是否正确。你可以发送确认提示:
然后它会运行测试,检查代码是否能通过。如果测试通过,任务就完成了。如果不通过,Microagent会反馈错误并修复代码,直到测试通过为止。
我们也可以用微代理创建一个实际应用。例如,我们可以创建一个Next.js应用并生成一个登录页面。首先,用以下命令创建一个Next.js应用:
npx create-next-app my-next-app
cd my-next-app
micro-agent
然后让微代理生成一个登录页面:
microagent会生成代码和测试脚本,并进行测试。如果测试失败,microagent会尝试修复代码。尽管如此,我们也发现了一些问题。如果AI生成的代码有缺陷,AI生成的测试脚本也可能有缺陷。如果测试脚本本身有问题,microagent可能会陷入一个循环,直到最终退出。这表明在某些复杂情况下,microagent可能并不完美。
我们也可以使用AMA来设置微代理。首先,访问Alama网站,下载并安装适用于你操作系统的软件。然后,选择Deep Seek Coder V2模型并安装:
Oalama install deep-seek-coder-v2
完成后,设置ollama API基地址指向本地主机和端口11434,然后设置模型
micro-agent config set OPENAI_API_ENDPOINT=http://localhost:11434
micro-agent config set MODEL=deepseek-coder-v2
完成这些设置后,你就可以使用microagent与ollama一起工作了。
总的来说,如果你通常进行功能编程并使用测试,microagent是一个不错的选择。它能够自动生成代码和测试脚本,并进行递归修复,直到所有测试通过。对于那些不使用测试的人来说,可能显得有些多余。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-26
AGI前夜!别再卷技术了,快来拯救世界!
2024-12-26
微软 OmniParser:如何让机器 “看懂” 手机电脑界面?
2024-12-26
Token已死?AI认知的新范式正在崛起
2024-12-26
字节和BAT,谁能缚住AI苍龙?
2024-12-26
大模型语义分析之嵌入(Embedding)模型
2024-12-26
Anthropic:高效构建AI Agent的最佳实践范式
2024-12-26
微软CEO纳德拉给出AI时代的关键答案:先有组织进化,才有技术突破(附视频)
2024-12-26
10分钟了解大模型应用全貌 : 大模型应用架构(LLM application architecture)
2024-05-28
2024-08-13
2024-04-26
2024-08-21
2024-07-09
2024-06-13
2024-08-04
2024-04-11
2024-07-18
2024-07-01