微信扫码
与创始人交个朋友
我要投稿
MicroAgent 是一种 AI 编码代理或文本到应用程序工具,可以生成代码并实时测试生成的代码。不过,它的方法存在一些问题,我将在本文中讨论这些问题。
https://github.com/BuilderIO/micro-agent
Hi,这里是Aitrainee,欢迎阅读本期新文章。
一般来说,我们目前看到的文本到应用程序软件可以相当不错地生成应用程序,尽管它们大多数有一个问题,那就是生成的代码并不总是可靠的。
这里的可靠性是指代码是否能在首次运行时正确工作。这是我们大多数编码代理面临的一个重大问题。
例如,使用像Aider这样的工具:
如果它生成了错误的代码,你需要来回与Aider交流,解决发生的错误等等。
这会成为一种麻烦,因为你无法依赖生成的代码,除非你自己进行了测试。
但是,如果我们使用的编码代理不仅能生成代码,还能为脚本编写测试,并运行测试以检查其是否正常工作,如果不正常,它还能修复呢?
这就是我今天要介绍的内容——MicroAgent。
MicroAgent是一种与传统编码代理方法不同的编码代理。
通常,常规的编码代理生成代码,完全依赖用户检查其是否正常工作。但MicroAgent首先生成代码,然后为代码生成测试,然后运行测试并检查是否通过。
如果代码通过了测试,则任务成功;如果没有,则将错误反馈给代理,代理修复代码,然后再次通过测试。这会递归进行,直到所有测试用例通过。
他们说,MicroAgent的理念是创建一个明确的测试用例,可以清楚地反馈代码是否按预期工作,并对代码进行迭代,直到所有测试用例通过。
它支持OpenAI的Claude,并允许更改OpenAI模型端点,从而支持使用Ollama和Groq。
因此,我将向你展示如何使用OpenAI和Ollama进行设置。让我们开始并检查一下。安装非常简单,你只需运行这个npm安装命令,它就会被安装。
一旦安装完成,你可以使用micro agent命令来使用它。但在此之前,我们需要先设置API密钥和模型。
我会先向你展示如何使用OpenAI,然后再展示如何使用AMA。只需运行这个config set openAI key命令,并输入你的API密钥。一旦完成,运行这个set model命令并将模型设置为GPT-4o。
一旦完成,我们可以开始使用它了。你可以导航到任何之前的项目,或者创建一个新目录并在其中使用它。
我将会在一个新目录中使用它。进入目录后,只需运行micro agent命令。如果你在一个空目录中运行它,它会要求你创建一个node项目。
好,现在完成了,让我们再次运行micro agent命令。现在你可以使用它了。让我们让它生成一个简单的程序来添加两个数字。
当你输入一个提示时,它会告诉你为文件命名,或者如果你不想命名,它也会为文件生成一个名称。你只需按下回车键即可使用生成的名称。
现在可以看到,它正在生成。它首先生成代码。一旦生成代码,它就会生成测试。
可以看到,现在代码生成了,测试也生成了。它在询问生成的测试是否正确。你需要发送“good”提示来告诉它测试是正确的,然后它会运行测试并检查是否正常工作,并在测试未通过时进行迭代修复。
好了,任务完成了,
现在让我们看看代码。
这看起来相当不错,程序是正确的,应该能正常工作。
测试也创建得很好,这也很棒。
但让我们也尝试用它做一些有用的事情。为此,让我们用create next app命令创建一个next应用程序。
现在让我们在这里启动micro agent。让我们让它创建一个登录页面,并告诉它这是一个nextjs应用程序。
好的,它正在生成代码、测试和所有相关内容。稍等一下。
好,经过多次尝试,测试未通过。
据我所知,如果AI生成的代码可能有问题,那么AI生成的测试也可能有问题,而且它没有任何解决办法。
所以,如果生成的测试有问题,它将无法正常工作。而且,如果测试多次失败,它也不会尝试修复测试脚本,这意味着如果第一次测试脚本不正确,它将一直卡在循环中,直到最终退出。
尽管如此,生成的代码仍然会放入文件夹中,所以你可以查看它。生成的页面看起来像这样,非常基础,感觉像是回到了90年代。
但我认为这是一个有缺陷的系统设计,因为它最终回到了AI生成代码的问题所在。我还尝试创建另一个只有一个标题标签的简单页面,它的测试也失败了。
我认为这个页面根本不需要测试。所以,我认为它可能在功能性脚本和类似有最终输出的东西方面表现不错,但除此之外就不行了。
现在让我也告诉你如何使用Ollama进行设置。首先,访问Alama网站,点击下载按钮,选择你的操作系统并进行安装。
安装完成后,转到模型页面,选择Deep Seek Coder V2模型。点击它并复制安装命令,然后将其粘贴到终端并安装。安装完成后,发送一条消息并检查是否正常工作。
现在我们需要将Alama的API基地址更改为本地主机和端口11434,就像这样,这将指向Alama。还要用这个命令将模型更改为Deep Seek Coder。
一旦完成,你现在可以与Ollam一起使用它了,它也能正常工作。
你还可以通过这个选项将其与其他兼容OpenAI的平台一起使用。
总体而言,我会说,如果你通常进行功能性编程并使用测试,这是一个不错的选择。
我不使用测试,因为我认为你只能活一次,我直接SSH进入服务器并直接编辑代码。但我认为现在人们正在使用测试,所以对于那些使用测试的人来说,它可能是有益的。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-15
OpenAI Agent来了!大小事务自动帮你搞定,带推送提醒的那种,今日可开玩
2025-01-15
微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!
2025-01-15
商汤破解世界模型秘诀,「日日新」实现AI大一统!原生融合模型破纪录双冠王
2025-01-14
前DeepMind专家:基于AlphaFold实现蛋白质预测,精度突破
2025-01-14
大模型开发工作手册详细指南
2025-01-14
Anthropic:Agents 最佳实践指南
2025-01-13
Google说:2025年,Agent改变一切!
2025-01-13
复盘2024,大模型的商业化主线是什么?
2024-08-13
2024-05-28
2024-04-26
2024-08-21
2024-06-13
2024-08-04
2024-09-23
2024-07-09
2024-07-01
2024-07-18