微信扫码
添加专属顾问
我要投稿
4月17日,阿里开源了CodeQwen1.5模型, CodeQwen1.5基于 Qwen 语言模型初始化,拥有 7B 参数的模型,其拥有 GQA 架构,经过了 ~3T tokens 代码相关的数据进行预训练,共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面,CodeQwen1.5 展现出了非凡的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率,并在不同的技术环境中简化软件开发工作流程。
仅拥有 70 亿参数的 CodeQwen1.5 在基础代码生成能力上已经超过了更尺寸的模型,进一步缩小了开源 CodeLLM 和 GPT-4 之间编码能力的差距。阿里对 HumanEval 和 MBPP 进行了评估,下面是具体的比较。
除了流行的 Humaneval 与 MBPP 外,阿里还注意到了 LiveCodeBench,LiveCodeBench 不断地从 LeetCode、AtCoder 和 CodeForces 三个竞赛平台中收集问题来测试模型的泛化能力。选择在 LiveCodeBench (2023-09-01->2024-04-01)上对 CodeQwen1.5 进行评估,结果展示出了 CodeQwen1.5 极具竞争力的效果。
上述的评估主要围绕 Python 能力,但 CodeQwen1.5 不仅仅是 Python 专家,还是一个多编程语言专家。在 MultiPL-E 的 8 种主流语言(Python、C++、Java、PHP、TypeScript、C#、Bash,JavaScript)上对 CodeQwen1.5 进行全面评估。这些结果证明了 CodeQwen1.5 强大的编程能力。
阿里还测试了CodeQwen1.5 在代码修改方面的能力。基于CodeEditorBench评测标准,涉及到 Debug、Translate、Switch、Polish 等四个方面的代码修改能力,结果表明 CodeQwen1.5 在 7B 规模上达到了最好的效果。
CodeQwen1.5 可以作为一个智能的 SQL 专家,弥合了非编程专业人士与高效数据交互之间的差距。它通过自然语言使无编程专业知识的用户能够查询数据库,阿里在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示,CodeQwen1.5在接近GPT-4的位置排名第二。
既然,CodeQwen具备这么强大的能力,那我们可以基于CodeQwen模型和CodeGPT插件,构建自己的AI编程助手。
CodeQwen1.5 隶属 Qwen1.5 开源家族,拥有CodeQwen1.5-7B 及 CodeQwen1.5-7B-Chat两个版本。目前已支持 Transformers, vLLM, llama.cpp, Ollama, 等等。
接下来,我们就使用ollama来部署一下:
C:\Users\zyn>ollama run codeqwen:7b-chat-v1.5-q4_0
pulling manifest
pulling 8e31a8360156... 100% ▕████████████████████████████████████████████████████████▏ 4.2 GB
pulling 6b53223f338a... 100% ▕████████████████████████████████████████████████████████▏ 6.9 KB
pulling 62fbfd9ed093... 100% ▕████████████████████████████████████████████████████████▏ 182 B
pulling f02dd72bb242... 100% ▕████████████████████████████████████████████████████████▏ 59 B
pulling f662c9193901... 100% ▕████████████████████████████████████████████████████████▏ 483 B
verifying sha256 digest
writing manifest
removing any unused layers
success
>>> Send a message (/? for help)
在Idea、Pycharm或VS Code插件市场搜索CodeGPT
进行安装。
配置CodeGPT采用Ollama加载CodeQwen-7B模型:
将插件预制提示词修改为中文:
Editor Actions:
编写测试: 为选中的代码 {{selectedCode}} 编写测试用例。请用中文回复。
查找Bugs: 在以下代码中查找Bugs并输出修复后的代码:{{selectedCode}}。请用中文回复。
优化代码: 优化选中的代码 {{selectedCode}}。请用中文回复。
重构代码: 重构选中的代码 {{selectedCode}}。请用中文回复。
解释代码: 解释选中的代码 {{selectedCode}}。请用中文回复。
Assistant Configuration System prompt:
您是一个AI编程助手。仔细遵循用户的要求和说明。您的回复应该具有启发性和逻辑性。您应该始终坚持技术信息。如果用户请求代码或技术问题,您必须提供代码建议并坚持技术信息。如果问题与开发人员相关,您必须回复与开发人员相关的内容。先逐步思考——用伪代码详细描述要构建的计划。然后在一个代码块中输出代码。尽量最小化其他文字描述。保持答案简短且不带个人色彩。在答案中使用Markdown格式。确保在Markdown代码块开头包含编程语言名称。避免将整个回复包装在三个反引号中。用户使用JetBrains开发的IDE,它有打开的文件编辑器、集成的单元测试支持,以及显示运行代码输出和集成终端的输出面板的概念。您每轮对话只能给出一个回复。
Commit Message Prompt:
在git diff的基础上编写一个简短且描述性的git commit信息。使用祈使语气,现在时态,主动语态和动词。您的整个回复将直接传递给git commit。
选中代码,右键选择CodeGPT可以进行代码优化、查找BUG、编写测试、解释代码、代码重构等。
当然,我们也可以在输入框输入自己想要问的问题,让CodeQwen给我们写代码:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-01
2025-01-01
2024-07-25
2025-02-04
2024-08-13
2024-04-25
2024-06-13
2024-08-21
2024-09-23
2024-04-26
2025-04-20
2025-04-20
2025-04-20
2025-04-19
2025-04-19
2025-04-18
2025-04-18
2025-04-17