我要投稿

（三）AI+BI：结合大语言模型实现对话式的智能报表系统

发布日期：2024-03-11 10:22:45 浏览次数： 3120 作者： AI产品经理研习与实践

—

SugarBI问数上手初体验

上面所提到的产品大多没有机会上手（例如内部产品或仍在测试阶段）体验，但总算在2月初申请到了百度SugarBI文心问数的体验权限。

参照官方指引，基于示例数据，我进行了简单的探索：

（1）数据模型准备

在数据模型的设置页面，可以选择对应的数据表并建立关系：

在编辑页面可以将字段名称设置为可读性较高的中文别名：

对于原子指标（度量），我们可以设置AI问答的同义词（也就是帮助大模型理解专业术语，可能用户会有不同的问法）作为其“知识库”：

我们也可以新建度量（指标加工），这就是常规的BI功能了：

对于AI问答功能，需要开启并等待模型训练完成才能使用（不过我没有权限）：

我们还可以配置AI问答的推荐问题，这个如果在ChatGPT中自定义过自己的GPTs的小伙伴应该很熟悉：

然后我们就可以通过智能问数Sugar Bot和系统进行交互了：

当我点击上图中的“需要结论”时，系统会自动总结如下：

并且还能发现数据的不合理之处（确实如此）：

整体上来说还是蛮有意思的，确实是一种全新的体验、并且是已经实际落地到现有产品中了。感兴趣的小伙伴可以自行申请体验。

值得注意的是，SugarBI有以下限制：

用户提出的问题字数限制为 300 字（空格也算做有效字符）——我想这主要是出于性能与成本控制的考虑。通过限制用户输入的字数，可以有效控制后端大模型处理请求的复杂度和资源消耗，同时鼓励用户提出更精炼、更具针对性的问题，提高处理速度和响应质量。因为除了用户输入的问题，如观远数据所说还需要给大模型传数据schema，因此压缩总的Prompt是必要的。
当生成的图表不符合预期时，可以点击「重生生成」但最多可以点击三次——为什么是3次？这个设计可能是为了防止用户无限制地重新生成结果，从而导致资源浪费和系统压力。限制重生次数可以鼓励用户更加仔细地考虑和优化他们的查询，同时也是一种计算资源的管理策略。此外，这也可能是基于用户行为的统计分析，认为三次重试足以覆盖大多数情况下的需求调整。
如果在大屏/报表编辑页面中关闭智能问数页面，Sugar BI将会清空之前会话的全部内容——这一限制可能是出于数据安全和隐私保护的考虑。自动清空会话内容可以防止敏感数据残留在系统中，尤其是在多用户环境下。此外，这也有助于保持系统的高效运行，避免不必要的数据积累影响性能。

—

思考与延伸

在前面的研习内容中，我们主要关注支持自然语言交互模式下的BI数据查询、分析和可视化呈现。实际上，在从问题定义、数据接入、处理、可视化展示、交互分析到决策行动的BI数据分析全链路中，AI大语言模型都有结合的机会。

在前面的研习内容中，我们主要关注支持自然语言交互模式下的BI数据查询、分析和可视化呈现。实际上，在从问题定义、数据接入、处理、可视化展示、交互分析到决策行动的BI数据分析全链路中，AI大语言模型都有结合的机会。让我们从产品经理的视角来粗略地考虑：

（1）问题定义：明确业务问题和目标。

问题: 确定分析的焦点，如提升销售额、优化库存等。
AI赋能: 使用AI模型生成初步的数据分析和决策计划草案，再人工校对修改，以确保方向和目标的准确性。

（2）数据接入：确定和接入数据源。

问题: 如何高效处理和分析非结构化数据。
AI赋能: 利用AI技术直接分析非结构化数据，减少传统的数据清洗步骤，加快从数据到洞察的过程。

（3）数据处理：数据的清洗、转换和加载（ETL）。

问题: 简化ETL开发过程，提高数据处理效率。
AI赋能: 通过自然语言交互生成ETL任务和代码，辅助数据处理，实现多轮交互式构建，提升数据处理的灵活性和准确性。

（4）可视化展现：将数据转化为易于理解的视觉形式。

问题: 快速响应业务问题，提供直观的数据结果和结论。
AI赋能: 自动根据问题生成SQL、JSON，利用AI生成文字结论、可视化图表和行动建议，实现问答式BI。

（5）交互分析：深入分析数据，生成深度分析报告。

问题: 如何自动化深度分析报告的生成，提供可信的业务分析。
AI赋能: 基于BI系统能力，结合企业内部数据源和AI生成的数据指标，自动识别异常原因并用自然语言展示，减少认知偏差（例如波动分析、异常分析和预警）。

（6）决策行动：基于分析结果，提供决策支持。

问题: 如何基于数据分析提供具体的未来行动建议。
AI赋能: 提供辅助性预测和基于历史数据的推荐建议，支持数据驱动的决策过程。

支付宝团队在基于蚂蚁集团基础大模型开发研制数据分析智能助理 Deepinsight copilot的过程中，比较系统化地梳理了结合大模型的数据分析智能助理功能需求，划分了不同的智能化等级，非常值得我们参考和学习：

注：

CoT即思维链（Chain-of-thought），模仿了一个逐步思考的过程来得出答案。
TOT即Tree-of-thoughts，CoT通常只有一条解决问题的路径，ToT等于是CoT的一个拓展，把一条reasoning路径拓展至多条reasong paths，这样模型可以综合多条reasoning path的结果得到最终的结论。
ReAct：即Reason和Action，Reason生成分析步骤，Action生成工具调用请求。是目前最常见和通用的增强式语言模型（Augmented LM)范式，它启发于传统强化学习，通过提示词构造“想法”（Thought），“行动”（Action），“观察”（Observation）的思维链，逐步启发大语言模型根据当前工具的输出产生观察，从而进一步产生下次推理。这种范式被广泛应用在近期爆火的 Auto-GPT 和 LangChain 等项目中。
ReWOO 即Reasoning WithOut Observation，通过模块化解耦（Decouple）大语言模型的“预见性推理”(Foreseeable Reasoning) 和工具的执行，从而实现在HotpotQA等任务上数倍的词元效率(Token Efficiency)，并且提高了模型表现以及复杂环境下的鲁棒性。在ReAct中，指令微调不可避免的会导致小模型“背住”训练集中的工具输出。然而，ReWOO由于将显式的工具输出跟模型的推理步骤分离，可以因此借由指令微调使其学会具有泛化性的“预见性推理”能力。
DAL我没有查到，我估计应该是DSL，即将自然语言转化为特定领域的语言（Domain-Specific Language），也就是我们前面提到的text-to-code。
KG即知识图谱，在上一篇文章中正好进行了比较深入的研习。