微信扫码
与创始人交个朋友
我要投稿
数据问答系统的架构可分为三大层次:
存储层(Storage):系统知识与数据的基础,包括业务逻辑、行业知识、数据元信息和预计算值(牧算值)。
计算层(Computing):系统的核心引擎,由多个智能代理(Agent)协同处理用户问题,包括问句优化、问题分类和SQL生成与优化。
记忆层(Memory):系统的智能性保障,负责对话上下文和任务状态的存储和管理,支持多轮对话和复杂任务的连续性。
存储层为系统提供了回答问题的知识储备和数据支撑。它是整个架构的底座,包含以下四个模块:
业务逻辑
功能:存储与企业相关的业务计算公式和逻辑规则,用于回答涉及数据计算的问题。
案例解析:用户问题:“今年的净利润率是多少?”
系统通过业务逻辑模块调用预设公式:
数据库中已存储净利润为500万元,营业收入为2000万元,计算结果为25%。
最终系统回答:“今年的净利润率为25%。”
行业知识
功能:提供行业特定的术语定义、规则规范和最佳实践,为系统解答行业专业性问题提供支持。
案例解析:用户问题:“建筑项目的综合造价指标是多少?”
系统查阅行业知识库,定义“综合造价指标”为“单位面积造价”。
根据数据库中的建筑面积和总造价数据,计算得出每平米造价。
最终回答:“该建筑项目的综合造价指标为每平米3000元。”
数据元信息
功能:存储数据库的元数据信息,包括表结构、字段定义和字段关系,为SQL生成提供关键支持。
案例解析:用户问题:“1月份的总销售额是多少?”
系统通过数据元信息模块确认:
销售额对应字段为sales_amount。
时间字段为sales_date。
最终生成SQL查询语句:
SELECT SUM(sales_amount)FROM salesWHERE sales_date BETWEEN '2023-01-01' AND '2023-01-31';
系统执行SQL并返回:“2023年1月的总销售额为500万元。”
牧算值(预计算值)
功能:存储高频使用的计算结果或中间结果,提升查询效率。
案例解析:用户问题:“昨天的订单转化率是多少?”
系统从牧算值模块直接调用预存的转化率数据,而非重新计算。
返回结果:“昨天的订单转化率为5.2%。”
ChatAgent:对话记忆与问句优化
功能:
维护对话上下文,实现多轮对话。
优化用户问句,消除歧义。
案例解析:用户连续提问:
“去年Q1的销售额是多少?”
“今年同期呢?”
ChatAgent通过上下文记忆将第二个问题补全为“2023年Q1的销售额是多少?”。
系统分别回答:“2022年Q1销售额为400万元,2023年Q1销售额为450万元,同比增长12.5%。”
SelectorAgent:问题分类与路径选择
功能:
根据问题类型进行智能分类。
确定最优的处理路径。
案例解析:用户问题:“今年的退货率是多少?”
SelectorAgent识别问题为“统计分析”类型。
系统选择适合的SQL生成路径,最终返回“退货率为2.3%”。
SQL GeneratorAgent Team:SQL生成与优化
SQL生成团队由多个子模块组成:
SQL Agent:生成初始SQL语句。
Verifier Agent:验证SQL与数据库的兼容性。
Refiner Agent:优化SQL性能。
NL2SQL+HuoX:结合大模型生成复杂SQL。
案例解析:用户问题:“查询2023年第一季度按地区分组的销售额。”
SQL Agent生成基础SQL语句:
SELECT region, SUM(sales_amount)FROM salesWHERE sales_date BETWEEN '2023-01-01' AND '2023-03-31'GROUP BY region;
Verifier Agent发现部分字段存在分区索引,建议调整分区。
Refiner Agent优化语句以提升查询效率,最终返回结果。
对话记忆
功能:维护多轮对话的上下文。
案例解析:用户提问:
“去年净利润是多少?”
“同比增长率呢?”
系统通过对话记忆补全第二个问题为“去年净利润与前年相比的同比增长率是多少?”并回答“增长率为15%”。
任务记忆
功能:记录用户的任务执行状态,支持复杂任务。
案例解析:用户问题:“按地区统计今年的销售额。”
系统记录任务状态。
用户追加提问:“江苏省呢?”系统直接返回江苏省数据,无需重新查询。
问题解析:
ChatAgent优化问题。
SelectorAgent分类为“数据查询”。
SQL生成与优化:
SQL GeneratorAgent Team生成SQL并优化:
SELECT SUM(sales_amount)FROM sales_partition_2023WHERE sales_date BETWEEN '2023-01-01' AND '2023-03-31';SELECT SUM(sales_amount)
3.答案返回:系统回答“今年1月至3月的总销售额为1200万元。”
财务分析:实时查询关键指标
案例:“2023年的毛利率是多少?” 系统回答:“2023年的毛利率为36.2%。”
运营监控:快速监测业务数据
案例:“今天的转化率是多少?” 系统回答:“今日转化率为4.8%。”
战略决策:支持管理层制定决策
案例:“过去三年的行业增长率是多少?” 系统回答:“行业增长率为8.5%。”
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-28
SuperSonic:Chat BI 与 Headless BI 新一代数据分析平台实践
2024-12-27
[Text2SQL]KeyInst: 通过关键指令来提升Text2SQL
2024-12-26
一文分享 ChatBI 实践经验
2024-12-26
周鸿祎谈AI落地之道:如何破解传统行业的应用难题
2024-12-26
AI与BI的火花:大语言模型如何重塑商业智能的未来
2024-12-26
复旦大学 METASQL:NL2SQL终于有候选排序了
2024-12-26
Text-to-SQL新SOTA!华科团队提出双向模式链接新方法RSL-SQL
2024-12-25
阿里内部观点:智能化研发一年复盘,我们离真正的 AI 开发还有多远?
2024-06-20
2024-06-14
2024-07-03
2024-06-14
2024-06-06
2024-06-16
2024-06-21
2024-10-09
2024-06-07
2024-07-24
2024-12-25
2024-12-25
2024-12-13
2024-11-19
2024-11-06
2024-10-25
2024-10-25
2024-10-25