我要投稿

在笔记本电脑上，实现NL2SQL对话式数据查询与分析

发布日期：2024-04-23 07:26:30 浏览次数： 3402

作者：大卫THINK

微信搜一搜，关注“大卫THINK”

‍现在，我们已经实现了在自己的笔记本电脑上，通过Ollama轻松使用Llama2、Gemma等模型。结合本地的个人文档知识库，通过AnythingLLM框架，实现检索增强生成RAG智能问答。

具体可以参见之前的两篇文章：

1

什么是对话式数据查询

企业有大量的应用系统，通常使用关系型数据库保存数据，可以通过大模型的自然语言转SQL语句（NL2SQL）能力，通过对话的方式进行查询和分析、展示。

现在，大模型的NL2SQL的能力已经得到迅速提升。但是，准确率尚不能令人满意。因此，如果要在实际场景应用的话，必须使用高质量的SQL问答语料进行微调训练，或借助检索增强生成（RAG）的技术，来提升准确率。

Vanna是一个开源项目，提供了一种基于RAG的NL2SQL应用框架。

在发送提问给大模型时，Vanna先检索相关的知识库，如库表结构、文档、准确的问答语料等，作为上下文（Context），一起发送给大模型，以期生成准确的SQL语句。架构流程如下图。

来源：https://vanna.ai/docs/

这套框架可以在我们的笔记本电脑上安装使用。Vanna官网给出了可选择不同组件的个性化安装说明，包括选择：大模型、关系型数据库、向量数据库和前端应用。

2

如何安装和使用Vanna

此前，我在笔记本电脑上已经安装了Ollama，并且下载了代码能力较强的DeepSeek-Coder 7B模型。

关系型数据库我选择默认的SQLite，向量数据库选择Chroma，并使用Vanna自带的基于Flask框架开发的前端应用。

可参考Vanna给出的相应的说明：

https://vanna.ai/docs/sqlite-ollama-chromadb/

第一步，安装Vanna及Chroma向量数据库。

pip install 'vanna[chromadb]'

第二步，创建demo.py，编写以下代码。

# 使用SQLite，Ollama和ChromaDB的方案
# 配置Vannafrom vanna.ollama import Ollamafrom vanna.chromadb.chromadb_vector import ChromaDB_VectorStore
class MyVanna(ChromaDB_VectorStore, Ollama):def __init__(self, config=None):ChromaDB_VectorStore.__init__(self, config=config)Ollama.__init__(self, config=config)
vn = MyVanna(config={'model': 'deepseek-coder:6.7b'})
# 创建SQlLite数据库连接，使用Vanna提供的样例数据vn.connect_to_sqlite('https://vanna.ai/Chinook.sqlite')
# 用数据表结构DDL训练，只需训练一次df_ddl = vn.run_sql("SELECT type, sql FROM sqlite_master WHERE sql is not null")
for ddl in df_ddl['sql'].to_list():vn.train(ddl=ddl)# 运行前端Flask Web应用from vanna.flask import VannaFlaskAppapp = VannaFlaskApp(vn)app.run()

第三步，运行demo.py，打开网址：http://localhost:8084，即可与大模型对话测试SQL生成效果。

Vanna在生成SQL语句之后，可以立即执行，从数据库查询到相应的数据，生成DataFrame，调用Plotly组件生成可视化图表。

系统还提供反馈机制，询问生成的SQL语句是否准确，如果用户标记为准确，则加入到训练数据（知识库）中。

3

SQL生成准确率如何

采用RAG辅助生成SQL，准确性到底怎么样呢？

Vanna在官网发布的白皮书《How to get high SQL accuracy rates using AI》，给出了以下实验结果。

来源：https://vanna.ai/blog/ai-sql-accuracy.html

以效果最好的大模型GPT4为例：

若仅使用数据表结构（schema），准确率只有10%
若增加3条样例查询，准确率提升到74%
若提供完整的上下文信息，包括库表结构、文档、经验证准确的问答语料等，准确率可达到88%

我在测试中使用的是Vanna自带的样例数据：Chinook.sqlite。在笔记本电脑上，我发送了一些简单的问题，可以生成准确的SQL，并画出图表。说明Vanna可以跑起来，还是比较令人振奋的。

但是，如果替换为此前ChatGLM金融大模型挑战赛的上市公司数据集，再进行测试，我发现系统不能生成准确的SQL语句，甚至基本的字段都没找对。

4

有哪些改进方向

我们要想生成准确的SQL语句，必须给大模型提供足够的相关的上下文信息。

因此，构建相关的训练数据（知识库），将成为Vanna能否实用的关键。

我认为可以在以下三个方向，进行改进。

在测试中，知识库只包含数据表结构（DDL），缺少充足的训练数据，尤其是人工检验准确的问答语料。
如果能先判断从哪个数据库、数据表、哪些字段获取数据，并提示给大模型，这样生成的准确率将会提升。
用户提问通常口语化、多样化、个性化，可以先准确识别用户的意图，进行完善补充规范后，再发送给大模型。

我们通常测试的都是整理过的样例或测试数据集。然而，企业内部的数据库与数据仓库，有成百上千张表，关系非常复杂，数据库表结构、字段命名也通常不太规范。

鉴于企业数据和场景的复杂性，在商业化落地时，如果仅使用Vanna提供的RAG框架，即使提供了较好的知识库，可能还不足以支撑。

这就需要我们针对具体应用场景，构建成千上万条训练语料，对模型进行增量预训练和微调，保证用户有良好的使用体验。

但是，构建知识库、做预训练和微调，总体成本不小。

所以，如果企业的应用场景，没有大量用户使用，频次也不高的话，那么投入产出比很低，建议采用其他方式来满足需求。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

重磅开源！Kimi K2.5 本地部署全攻略：手把手教你跑通 1T MoE 巨兽

2026-01-30

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

Clawdbot 深度拆解： 7 个问题看懂它。

2026-01-29

Claude Code Skills 国内实践全指南：从安装部署到高阶开发

2026-01-09

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

大家都在问

为什么这波 AI 产品都开始抢着做 CLI ？

2026-03-31

Harness Engineering 来了，SDD 还有意义吗？

2026-03-31

为什么一夜之间大家都在做 CLI？

2026-03-30

飞书 CLI 开源了，为什么 AI Agent 时代，大家都在做命令行工具？

2026-03-30

龙虾之父 Peter 亲自点赞，这只国产 Agent 到底做对了什么？

2026-03-26

技多不压身，那龙虾的 Skill 是越多越好吗？

2026-03-23

OpenAI不会干黄了吧？

2026-03-22

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？

2026-03-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部