微信扫码
与创始人交个朋友
我要投稿
Ollama 工具强大,助您轻松构建大语言模型应用!核心内容:1. Ollama 在不同系统的安装方法2. Ollama 的常用命令3. 结合 Ollama 打造代码补全助手
Ollama是一个用于构建大语言模型应用的工具,它提供了一些简单易用的CLI和服务器,能够让用户轻松下载、运行和管理各种开源LLM。
一. 如何使用?
本文以 windows 环境为例,但实际体验来看,同等硬件环境下 linux 系统体验会更流畅些。
1.1 安装ollama
https://ollama.com/download/OllamaSetup.exe
特别记录下Docker版本的安装:
CPU版本
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
GPU版本
同时还需要先安装 Nvida container toolkit,
下载链接如下
https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#installation
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
Ollama常用命令
启动ollama
ollama serve
查看已有模型列表
ollama list
下载模型-以千问72b为例
ollama pull qwen2:72b
运行模型
ollama run qwen2:72b
docker容器运行模型
docker exec -it ollama ollama run qwen2:72b
AI提效-本地代码补全助手+AI助手
我们通过结合代码生成模型+Ollama+IDE插件来打造一个强大的、模块化的、自娱自乐的代码补全助手。例如使用 Codeqwen 7B模型+vscode的continue插件,即可实现高效便捷的代码补全功能。
推荐的模型组合:Codeqwen 7b+Qwen2 7B模型
ollama run codeqwen
ollama run qwen2:7b
这两个模型中,codeqwen 7b是一个专门用于代码补全的模型,qwen2 7b又是个通用的聊天模型,并且两者都不是重量级模型,在本地运行也不会那么费劲。这两个模型结合起来就能很好地实现代码补全+AI助手的聊天功能。
下载并运行好上述两个模型后,再去到vscode 进行配置,编辑 continue插件的config.json :
{
"models": [
{
"title": "Codeqwen 7B",
"provider": "ollama",
"model": "codeqwen",
"apiBase": "http://127.0.0.1:11434"
}
],
"tabAutocompleteModel": {
"title": "Qwen2 7B",
"provider": "ollama",
"model": "qwen2:7b",
"apiBase": "http://127.0.0.1:11434"
}
}
再加上RAG向量检索优化聊天
首先,continue插件内置了 @codebase 上下文provider,能自动从代码库检索到最相关的代码片段。假如我们用自己的本地的聊天模型,那么借助 Ollama与LanceDB向量化技术,可以去更高效的进行代码检索和聊天体验。
ollama pull nomic-embed-text
ollama run nomic-embed-text
继续配置 config.json
都折腾完了之后跑下试试
代码补全效果及对话功能验证
其他有价值的点还包括代码自动注释等功能可自行拓展。
至此,一个乞丐版 cursor 基本搭建完成了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-24
腾讯开源了混元3D模型生成后,各大开源3D模型生成对比
2025-01-24
2024年总结:人人都能实现高效的AI+方法论
2025-01-24
用自然语言控制电脑,字节跳动开源 UI-TARS 的桌面版应用!内附详细的安装和配置教程
2025-01-23
DeepSeek-R1论文速读
2025-01-22
提升RAG效率,从这五大开源数据抓取工具开始
2025-01-22
DeepSeek Engineer:集成 DeepSeek API 的开源 AI 编程助手,支持文件读取、编辑并生成结构化响应
2025-01-22
无需GPU本地轻松运行AI模型的开源项目LocalAI
2025-01-22
Cursor平替,Cline插件+DeepSeek使用教程和实际体验
2024-07-25
2024-05-06
2024-08-13
2024-06-12
2025-01-01
2024-07-11
2024-07-20
2024-09-20
2024-06-16
2024-06-10
2025-01-22
2025-01-16
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13