AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


MicroAgent:这个AI智能体一键写代码并且自动测试!它比 Aider 更好吗?(Ollama)
发布日期:2024-07-19 20:05:04 浏览次数: 2521



MicroAgent 是一种 AI 编码代理或文本到应用程序工具,可以生成代码并实时测试生成的代码。不过,它的方法存在一些问题,我将在本文中讨论这些问题。

MicroAgent 还可以与任何开源 LLM、OpenAI 模型或其他 Claude 模型一起使用,例如 GPT-4O、Claude-3、CodeQwen、Mixtral 8x22b、Mixtral 8x7b、GPT-4、Grok-1.5 和 Gemini Code Assist。

https://github.com/BuilderIO/micro-agent

Hi,这里是Aitrainee,欢迎阅读本期新文章。

一般来说,我们目前看到的文本到应用程序软件可以相当不错地生成应用程序,尽管它们大多数有一个问题,那就是生成的代码并不总是可靠的。

这里的可靠性是指代码是否能在首次运行时正确工作。这是我们大多数编码代理面临的一个重大问题。

例如,使用像Aider这样的工具:

如果它生成了错误的代码,你需要来回与Aider交流,解决发生的错误等等。

这会成为一种麻烦,因为你无法依赖生成的代码,除非你自己进行了测试。

但是,如果我们使用的编码代理不仅能生成代码,还能为脚本编写测试,并运行测试以检查其是否正常工作,如果不正常,它还能修复呢?

这就是我今天要介绍的内容——MicroAgent。

MicroAgent是一种与传统编码代理方法不同的编码代理。

通常,常规的编码代理生成代码,完全依赖用户检查其是否正常工作。但MicroAgent首先生成代码,然后为代码生成测试,然后运行测试并检查是否通过。

如果代码通过了测试,则任务成功;如果没有,则将错误反馈给代理,代理修复代码,然后再次通过测试。这会递归进行,直到所有测试用例通过。

他们说,MicroAgent的理念是创建一个明确的测试用例,可以清楚地反馈代码是否按预期工作,并对代码进行迭代,直到所有测试用例通过。

它支持OpenAI的Claude,并允许更改OpenAI模型端点,从而支持使用Ollama和Groq。

因此,我将向你展示如何使用OpenAI和Ollama进行设置。让我们开始并检查一下。安装非常简单,你只需运行这个npm安装命令,它就会被安装。

一旦安装完成,你可以使用micro agent命令来使用它。但在此之前,我们需要先设置API密钥和模型。

我会先向你展示如何使用OpenAI,然后再展示如何使用AMA。只需运行这个config set openAI key命令,并输入你的API密钥。一旦完成,运行这个set model命令并将模型设置为GPT-4o。

一旦完成,我们可以开始使用它了。你可以导航到任何之前的项目,或者创建一个新目录并在其中使用它。

我将会在一个新目录中使用它。进入目录后,只需运行micro agent命令。如果你在一个空目录中运行它,它会要求你创建一个node项目。

好,现在完成了,让我们再次运行micro agent命令。现在你可以使用它了。让我们让它生成一个简单的程序来添加两个数字。

当你输入一个提示时,它会告诉你为文件命名,或者如果你不想命名,它也会为文件生成一个名称。你只需按下回车键即可使用生成的名称。

现在可以看到,它正在生成。它首先生成代码。一旦生成代码,它就会生成测试。

可以看到,现在代码生成了,测试也生成了。它在询问生成的测试是否正确。你需要发送“good”提示来告诉它测试是正确的,然后它会运行测试并检查是否正常工作,并在测试未通过时进行迭代修复。

好了,任务完成了,

现在让我们看看代码。

这看起来相当不错,程序是正确的,应该能正常工作。

测试也创建得很好,这也很棒。

但让我们也尝试用它做一些有用的事情。为此,让我们用create next app命令创建一个next应用程序。

现在让我们在这里启动micro agent。让我们让它创建一个登录页面,并告诉它这是一个nextjs应用程序。

好的,它正在生成代码、测试和所有相关内容。稍等一下。

好,经过多次尝试,测试未通过。

据我所知,如果AI生成的代码可能有问题,那么AI生成的测试也可能有问题,而且它没有任何解决办法。

所以,如果生成的测试有问题,它将无法正常工作。而且,如果测试多次失败,它也不会尝试修复测试脚本,这意味着如果第一次测试脚本不正确,它将一直卡在循环中,直到最终退出。

尽管如此,生成的代码仍然会放入文件夹中,所以你可以查看它。生成的页面看起来像这样,非常基础,感觉像是回到了90年代。

但我认为这是一个有缺陷的系统设计,因为它最终回到了AI生成代码的问题所在。我还尝试创建另一个只有一个标题标签的简单页面,它的测试也失败了。

我认为这个页面根本不需要测试。所以,我认为它可能在功能性脚本和类似有最终输出的东西方面表现不错,但除此之外就不行了。

现在让我也告诉你如何使用Ollama进行设置。首先,访问Alama网站,点击下载按钮,选择你的操作系统并进行安装。

安装完成后,转到模型页面,选择Deep Seek Coder V2模型。点击它并复制安装命令,然后将其粘贴到终端并安装。安装完成后,发送一条消息并检查是否正常工作。

现在我们需要将Alama的API基地址更改为本地主机和端口11434,就像这样,这将指向Alama。还要用这个命令将模型更改为Deep Seek Coder。

一旦完成,你现在可以与Ollam一起使用它了,它也能正常工作。

你还可以通过这个选项将其与其他兼容OpenAI的平台一起使用。

总体而言,我会说,如果你通常进行功能性编程并使用测试,这是一个不错的选择。

我不使用测试,因为我认为你只能活一次,我直接SSH进入服务器并直接编辑代码。但我认为现在人们正在使用测试,所以对于那些使用测试的人来说,它可能是有益的。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询