我要投稿

编程助手使用

发布日期：2024-04-18 17:07:07 浏览次数： 2732 作者：AI工程师笔记

CodeQwen介绍

4月17日，阿里开源了CodeQwen1.5模型， CodeQwen1.5基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了非凡的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

性能表现

仅拥有 70 亿参数的 CodeQwen1.5 在基础代码生成能力上已经超过了更尺寸的模型，进一步缩小了开源 CodeLLM 和 GPT-4 之间编码能力的差距。阿里对 HumanEval 和 MBPP 进行了评估，下面是具体的比较。

除了流行的 Humaneval 与 MBPP 外，阿里还注意到了 LiveCodeBench，LiveCodeBench 不断地从 LeetCode、AtCoder 和 CodeForces 三个竞赛平台中收集问题来测试模型的泛化能力。选择在 LiveCodeBench (2023-09-01->2024-04-01)上对 CodeQwen1.5 进行评估，结果展示出了 CodeQwen1.5 极具竞争力的效果。

上述的评估主要围绕 Python 能力，但 CodeQwen1.5 不仅仅是 Python 专家，还是一个多编程语言专家。在 MultiPL-E 的 8 种主流语言（Python、C++、Java、PHP、TypeScript、C#、Bash，JavaScript）上对 CodeQwen1.5 进行全面评估。这些结果证明了 CodeQwen1.5 强大的编程能力。

阿里还测试了CodeQwen1.5 在代码修改方面的能力。基于CodeEditorBench评测标准，涉及到 Debug、Translate、Switch、Polish 等四个方面的代码修改能力，结果表明 CodeQwen1.5 在 7B 规模上达到了最好的效果。

CodeQwen1.5 可以作为一个智能的 SQL 专家，弥合了非编程专业人士与高效数据交互之间的差距。它通过自然语言使无编程专业知识的用户能够查询数据库，阿里在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示，CodeQwen1.5在接近GPT-4的位置排名第二。

既然，CodeQwen具备这么强大的能力，那我们可以基于CodeQwen模型和CodeGPT插件，构建自己的AI编程助手。

模型部署

CodeQwen1.5 隶属 Qwen1.5 开源家族，拥有CodeQwen1.5-7B 及 CodeQwen1.5-7B-Chat两个版本。目前已支持 Transformers, vLLM, llama.cpp, Ollama, 等等。

接下来，我们就使用ollama来部署一下：

C:\Users\zyn>ollama run codeqwen:7b-chat-v1.5-q4_0
pulling manifest
pulling 8e31a8360156... 100% ▕████████████████████████████████████████████████████████▏ 4.2 GB
pulling 6b53223f338a... 100% ▕████████████████████████████████████████████████████████▏ 6.9 KB
pulling 62fbfd9ed093... 100% ▕████████████████████████████████████████████████████████▏  182 B
pulling f02dd72bb242... 100% ▕████████████████████████████████████████████████████████▏   59 B
pulling f662c9193901... 100% ▕████████████████████████████████████████████████████████▏  483 B
verifying sha256 digest
writing manifest
removing any unused layers
success
>>> Send a message (/? for help)

CodeGPT插件安装

在Idea、Pycharm或VS Code插件市场搜索CodeGPT进行安装。

配置CodeGPT采用Ollama加载CodeQwen-7B模型：

将插件预制提示词修改为中文：

Editor Actions:

编写测试: 为选中的代码 {{selectedCode}} 编写测试用例。请用中文回复。
查找Bugs: 在以下代码中查找Bugs并输出修复后的代码：{{selectedCode}}。请用中文回复。
优化代码: 优化选中的代码 {{selectedCode}}。请用中文回复。
重构代码: 重构选中的代码 {{selectedCode}}。请用中文回复。
解释代码: 解释选中的代码 {{selectedCode}}。请用中文回复。

Assistant Configuration System prompt:

您是一个AI编程助手。仔细遵循用户的要求和说明。您的回复应该具有启发性和逻辑性。您应该始终坚持技术信息。如果用户请求代码或技术问题,您必须提供代码建议并坚持技术信息。如果问题与开发人员相关,您必须回复与开发人员相关的内容。先逐步思考——用伪代码详细描述要构建的计划。然后在一个代码块中输出代码。尽量最小化其他文字描述。保持答案简短且不带个人色彩。在答案中使用Markdown格式。确保在Markdown代码块开头包含编程语言名称。避免将整个回复包装在三个反引号中。用户使用JetBrains开发的IDE,它有打开的文件编辑器、集成的单元测试支持,以及显示运行代码输出和集成终端的输出面板的概念。您每轮对话只能给出一个回复。

Commit Message Prompt: