我要投稿

aixcoder-7B ：最先进的代码补全、理解、生成等代码大语言模型

发布日期：2024-04-25 12:05:39 浏览次数： 2298 作者：GitHubStore

项目简介

随着大型代码模型的能力逐渐被挖掘出来，aiXcoder 一直在思考如何让这些模型在实际开发场景中更加有益。为此，我们开源了 aiXcoder 7B Base，它经过了 1.2T Unique Token 的广泛训练，模型的预训练任务以及上下文信息都是针对真实世界的代码生成上下文而设计的。

在所有参数大小相似的模型中，aiXcoder 7B Base 是代码完成场景中最有效的模型，在多语言 nl2code 基准测试中的平均性能也超过了 codellama 34B 和 StarCoder2 15B 等主流模型。

在我们不断探索应用大型代码模型的过程中，aiXcoder 7B Base 的发布代表了一个重要的里程碑。当前版本的aiXcoder 7B Base是一个基础模型，专注于提高代码完成和代码生成任务的效率和准确性，旨在为开发者在这些场景下提供强大的支持。需要注意的是，此版本尚未经过特定的指令调整，这意味着它可能尚未为专门的高级任务（如测试用例生成和代码调试）提供最佳性能。

但是，我们已经计划进一步开发 aiXcoder 模型系列。在不久的将来，我们的目标是发布该模型的新版本，这些版本经过精心指导，适用于更广泛的编程任务，包括但不限于测试用例生成和代码调试。通过这些指令调整模型，我们希望为开发人员提供更全面、更深入的编程支持，帮助他们在软件开发的每个阶段最大限度地提高效率。

aiXcoder 7B 在 nl2code 基准测试中超越了主流型号。aiXcoder-7B 是 aiXcoder-7B-Base 的增强功能，对十万个数据条目进行了微调，类似于一个纪元的 Evol-instruct。

快速入门

环境要求

选项 1：构建环境

若要运行模型推理代码，需要以下环境设置：

Python 3.8 或更高版本
PyTorch 2.1.0 或更高版本
Sentencepiece 0.2.0 或更高版本
transformers 4.34.1 或更高版本（如果通过 transformers 库运行推理）

请确保使用以下命令安装所有依赖项：

conda create -n aixcoder-7b python=3.11conda activate aixcoder-7bgit clone git@github.com:aixcoder-plugin/aiXcoder-7b.gitcd aiXcoder-7bpip install -r requirements.txt

requirements.txt 列出了所有必要的库及其版本。

为了实现更快的推理速度，尤其是对于大型模型，我们建议安装 flash attention . Flash attention 是一种优化的注意力机制，可在不牺牲精度的情况下显著减少基于 transformer 的模型的计算时间。

在继续操作之前，请确保您的环境满足 CUDA 要求，因为 flash attention 利用了 GPU 加速。请按照以下步骤安装 flash attention ：

git clone git@github.com:Dao-AILab/flash-attention.gitcd flash-attentionMAX_JOBS=8 python setup.py install

选项 2：Docker

对于一致且隔离的环境，我们建议使用 Docker 运行模型推理代码。下面介绍了如何为我们的模型设置和使用 Docker：

安装 Docker：如果尚未安装，请在计算机上安装 Docker。
拉取 Docker 镜像：从 Docker Hub 拉取 Docker 镜像。

docker pull pytorch/pytorch:2.1.0-cuda11.8-cudnn8-devel

运行容器：拉取映像后，可以在 Docker 容器中运行模型。

docker run --gpus all -it -v /dev/shm:/dev/shm --name aix_instance pytorch/pytorch:2.1.0-cuda11.8-cudnn8-devel /bin/bashpip install sentencepiecegit clone git@github.com:aixcoder-plugin/aiXcoder-7b.gitcd aiXcoder-7b

此命令从 pytorch 映像启动名为 aix_instance 的容器。您可以与此容器中的模型进行交互。

为了实现更快的推理速度，尤其是对于大型模型，我们建议安装 flash attention .

git clone git@github.com:Dao-AILab/flash-attention.gitcd flash-attentionMAX_JOBS=8 python setup.py install

模型推理：在 Docker 容器中，您可以运行模型推理代码，如推理示例部分所述。

使用 Docker 提供了一个干净、可控的环境，可最大程度地减少与软件版本和依赖项相关的问题。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB