微信扫码
与创始人交个朋友
我要投稿
导读 ChatDBA 是由上海爱可生开发的一款数据库运维领域的智能辅助系统,通过对话交互,提供数据库故障诊断、专业知识学习、SQL 生成和优化等功能,旨在提升 DBA 工作效率。本文将介绍 ChatDBA 是如何利用大语言模型实现其数据库故障诊断智能助手功能的。
1. 背景介绍
2. ChatDBA 架构
3. 挑战与解决思路
4. 未来展望
分享嘉宾|李剑楠 上海爱可生信息技术股份有限公司 高级研发工程师
编辑整理|程思琪
内容校对|李瑶
出品社区|DataFun
背景介绍
技术架构
挑战与解决思路
1. 故障排查逻辑树
2. 信息检索
多路召回:结合关键词和向量检索,提升召回率。
查询重写/扩充:将用户查询细化为不同主题的子问题,扩大召回数量。
查询重写 查询扩充
多模态检索:针对不同结构数据(文本、图片、表格)进行多模态、多向量的检索。
垂直领域增强:构建特定场景的数据集,增强模型表征能力。当前行业内做向量索引和表征学习往往是在不同阶段执行,导致模型在向量空间中检索得到的结果准确率很高,但是实际应用不尽如人意,为此有部分研究者开始研究向量索引和表征学习的联合计算,解决向量检索和表征学习目标割裂的问题。
图 RAG:利用知识图谱建模实体关系,进行多跳检索。这类方法更适用于用户提问问题明确,且已具备高精度的行业知识图谱后。另外,多跳检索在大数据量的应用场景中,用户的等待时间会逐渐变得不可接受,如何进行检索调优是重点关注方向。
3. 文档处理
格式化:将工单内容格式化为故障现象、原因、排查方法和解决方案四部分。
查询重写:结合对话历史,重写查询为梳理故障现象的表达,在故障现象库中进行向量检索,从召回的工单中提取排查方法和解决方案,输送到 LLM 中作为 prompt 的一部分。为了提升模型回答的效果,我们采用了分治的思想,让模型同步分析多个文档中,每篇工单对当前问题起到了什么帮助,如果有帮助,就形成当前树结构的一个补丁,最后通过合并补丁,实现完整的排查逻辑树的生成。
4. 记忆问题
5. 意图识别
6. 可观测性和评估
7. 时间成本
8. ChatDBA 的核心特性
关键信息提取模块:从不同类型(监控图、图表、长日志、工单等)输入中提取与故障相关的信息。
SQL 优化和生成:利用 NL2SQL 技术处理 SQL 相关问题。
知识学习模块:帮助 DBA 快速学习和迭代进步。
未来展望
多模态处理:处理工单系统中的图片、日志等非文本信息,进一步提升 ChatDBA 的信息处理能力。
实时监控组件接入:支持自动化巡检、分析报表等功能,帮助 DBA 更好地掌握数据库运行状态。
知识图谱构建:构建更全面、更精准的数据库知识图谱,为 ChatDBA 提供更强大的知识支撑。
个性化推荐:根据用户历史行为和偏好,为 DBA 推荐相关学习资料和故障排查方案。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-02
数势科技智能分析AI Agent 何以在市场中脱颖而出?
2025-01-02
拥抱AI,从组织变革开始
2024-12-31
AI Agent引领,火山引擎HiAgent助力实体产业智能化升级
2024-12-28
SuperSonic:Chat BI 与 Headless BI 新一代数据分析平台实践
2024-12-27
[Text2SQL]KeyInst: 通过关键指令来提升Text2SQL
2024-12-26
一文分享 ChatBI 实践经验
2024-12-26
周鸿祎谈AI落地之道:如何破解传统行业的应用难题
2024-12-26
AI与BI的火花:大语言模型如何重塑商业智能的未来
2024-06-20
2024-06-14
2024-07-03
2024-06-14
2024-06-16
2024-06-06
2024-10-09
2024-06-21
2024-06-07
2024-07-24
2025-01-02
2024-12-25
2024-12-25
2024-12-13
2024-11-19
2024-11-06
2024-10-25
2024-10-25