AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


编程助手使用
发布日期:2024-04-18 17:07:07 浏览次数: 2046


CodeQwen介绍

4月17日,阿里开源了CodeQwen1.5模型, CodeQwen1.5基于 Qwen 语言模型初始化,拥有 7B 参数的模型,其拥有 GQA 架构,经过了 ~3T tokens 代码相关的数据进行预训练,共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面,CodeQwen1.5 展现出了非凡的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率,并在不同的技术环境中简化软件开发工作流程。

性能表现

仅拥有 70 亿参数的 CodeQwen1.5 在基础代码生成能力上已经超过了更尺寸的模型,进一步缩小了开源 CodeLLM 和 GPT-4 之间编码能力的差距。阿里对 HumanEval 和 MBPP 进行了评估,下面是具体的比较。

除了流行的 Humaneval 与 MBPP 外,阿里还注意到了 LiveCodeBench,LiveCodeBench 不断地从 LeetCode、AtCoder 和 CodeForces 三个竞赛平台中收集问题来测试模型的泛化能力。选择在 LiveCodeBench (2023-09-01->2024-04-01)上对 CodeQwen1.5 进行评估,结果展示出了 CodeQwen1.5 极具竞争力的效果。

上述的评估主要围绕 Python 能力,但 CodeQwen1.5 不仅仅是 Python 专家,还是一个多编程语言专家。在 MultiPL-E 的 8 种主流语言(Python、C++、Java、PHP、TypeScript、C#、Bash,JavaScript)上对 CodeQwen1.5 进行全面评估。这些结果证明了 CodeQwen1.5 强大的编程能力。

阿里还测试了CodeQwen1.5 在代码修改方面的能力。基于CodeEditorBench评测标准,涉及到 Debug、Translate、Switch、Polish 等四个方面的代码修改能力,结果表明 CodeQwen1.5 在 7B 规模上达到了最好的效果。

CodeQwen1.5 可以作为一个智能的 SQL 专家,弥合了非编程专业人士与高效数据交互之间的差距。它通过自然语言使无编程专业知识的用户能够查询数据库,阿里在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示,CodeQwen1.5在接近GPT-4的位置排名第二。

既然,CodeQwen具备这么强大的能力,那我们可以基于CodeQwen模型和CodeGPT插件,构建自己的AI编程助手。

模型部署

CodeQwen1.5 隶属 Qwen1.5 开源家族,拥有CodeQwen1.5-7B 及 CodeQwen1.5-7B-Chat两个版本。目前已支持 Transformers, vLLM, llama.cpp, Ollama, 等等。

接下来,我们就使用ollama来部署一下:

C:\Users\zyn>ollama run codeqwen:7b-chat-v1.5-q4_0
pulling manifest
pulling 8e31a8360156... 100% ▕████████████████████████████████████████████████████████▏ 4.2 GB
pulling 6b53223f338a... 100% ▕████████████████████████████████████████████████████████▏ 6.9 KB
pulling 62fbfd9ed093... 100% ▕████████████████████████████████████████████████████████▏  182 B
pulling f02dd72bb242... 100% ▕████████████████████████████████████████████████████████▏   59 B
pulling f662c9193901... 100% ▕████████████████████████████████████████████████████████▏  483 B
verifying sha256 digest
writing manifest
removing any unused layers
success
>>> Send a message (/? for help)

CodeGPT插件安装

在Idea、Pycharm或VS Code插件市场搜索CodeGPT进行安装。

配置CodeGPT采用Ollama加载CodeQwen-7B模型:

将插件预制提示词修改为中文:

Editor Actions:

编写测试: 为选中的代码 {{selectedCode}} 编写测试用例。请用中文回复。

查找Bugs: 在以下代码中查找Bugs并输出修复后的代码:{{selectedCode}}。请用中文回复。

优化代码: 优化选中的代码 {{selectedCode}}。请用中文回复。

重构代码: 重构选中的代码 {{selectedCode}}。请用中文回复。

解释代码: 解释选中的代码 {{selectedCode}}。请用中文回复。

Assistant Configuration System prompt:

您是一个AI编程助手。仔细遵循用户的要求和说明。您的回复应该具有启发性和逻辑性。您应该始终坚持技术信息。如果用户请求代码或技术问题,您必须提供代码建议并坚持技术信息。如果问题与开发人员相关,您必须回复与开发人员相关的内容。先逐步思考——用伪代码详细描述要构建的计划。然后在一个代码块中输出代码。尽量最小化其他文字描述。保持答案简短且不带个人色彩。在答案中使用Markdown格式。确保在Markdown代码块开头包含编程语言名称。避免将整个回复包装在三个反引号中。用户使用JetBrains开发的IDE,它有打开的文件编辑器、集成的单元测试支持,以及显示运行代码输出和集成终端的输出面板的概念。您每轮对话只能给出一个回复。

Commit Message Prompt:

在git diff的基础上编写一个简短且描述性的git commit信息。使用祈使语气,现在时态,主动语态和动词。您的整个回复将直接传递给git commit。

编程助手使用

选中代码,右键选择CodeGPT可以进行代码优化、查找BUG、编写测试、解释代码、代码重构等。

当然,我们也可以在输入框输入自己想要问的问题,让CodeQwen给我们写代码:



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询