AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


(三)AI+BI:结合大语言模型实现对话式的智能报表系统
发布日期:2024-03-11 10:22:45 浏览次数: 2171 来源: AI产品经理研习与实践


05


SugarBI问数上手初体验


上面所提到的产品大多没有机会上手(例如内部产品或仍在测试阶段)体验,但总算在2月初申请到了百度SugarBI文心问数的体验权限。

图片

参照官方指引,基于示例数据,我进行了简单的探索:

(1)数据模型准备

图片

在数据模型的设置页面,可以选择对应的数据表并建立关系:

图片

在编辑页面可以将字段名称设置为可读性较高的中文别名:

图片

对于原子指标(度量),我们可以设置AI问答的同义词(也就是帮助大模型理解专业术语,可能用户会有不同的问法)作为其“知识库”:

图片

图片

图片

我们也可以新建度量(指标加工),这就是常规的BI功能了:

图片

对于AI问答功能,需要开启并等待模型训练完成才能使用(不过我没有权限):

图片

我们还可以配置AI问答的推荐问题,这个如果在ChatGPT中自定义过自己的GPTs的小伙伴应该很熟悉:

图片

然后我们就可以通过智能问数Sugar Bot和系统进行交互了:

图片

图片

图片

图片

当我点击上图中的“需要结论”时,系统会自动总结如下:

图片

图片

并且还能发现数据的不合理之处(确实如此):

图片

整体上来说还是蛮有意思的,确实是一种全新的体验、并且是已经实际落地到现有产品中了。感兴趣的小伙伴可以自行申请体验。

值得注意的是,SugarBI有以下限制:

  • 用户提出的问题字数限制为 300 字(空格也算做有效字符)——我想这主要是出于性能与成本控制的考虑。通过限制用户输入的字数,可以有效控制后端大模型处理请求的复杂度和资源消耗,同时鼓励用户提出更精炼、更具针对性的问题,提高处理速度和响应质量。因为除了用户输入的问题,如观远数据所说还需要给大模型传数据schema,因此压缩总的Prompt是必要的。
  • 当生成的图表不符合预期时,可以点击「重生生成」但最多可以点击三次——为什么是3次?这个设计可能是为了防止用户无限制地重新生成结果,从而导致资源浪费和系统压力。限制重生次数可以鼓励用户更加仔细地考虑和优化他们的查询,同时也是一种计算资源的管理策略。此外,这也可能是基于用户行为的统计分析,认为三次重试足以覆盖大多数情况下的需求调整。
  • 如果在大屏/报表编辑页面中关闭智能问数页面,Sugar BI将会清空之前会话的全部内容——这一限制可能是出于数据安全和隐私保护的考虑。自动清空会话内容可以防止敏感数据残留在系统中,尤其是在多用户环境下。此外,这也有助于保持系统的高效运行,避免不必要的数据积累影响性能。



06



思考与延伸



在前面的研习内容中,我们主要关注支持自然语言交互模式下的BI数据查询、分析和可视化呈现。实际上,从问题定义、数据接入、处理、可视化展示、交互分析到决策行动的BI数据分析全链路中,AI大语言模型都有结合的机会。


图片


在前面的研习内容中,我们主要关注支持自然语言交互模式下的BI数据查询、分析和可视化呈现。实际上,在从问题定义、数据接入、处理、可视化展示、交互分析到决策行动的BI数据分析全链路中,AI大语言模型都有结合的机会。让我们从产品经理的视角来粗略地考虑:


(1)问题定义:明确业务问题和目标。

  • 问题: 确定分析的焦点,如提升销售额、优化库存等。
  • AI赋能: 使用AI模型生成初步的数据分析和决策计划草案,再人工校对修改,以确保方向和目标的准确性。


(2)数据接入:确定和接入数据源。

  • 问题: 如何高效处理和分析非结构化数据。
  • AI赋能: 利用AI技术直接分析非结构化数据,减少传统的数据清洗步骤,加快从数据到洞察的过程。


(3)数据处理:数据的清洗、转换和加载(ETL)。

  • 问题: 简化ETL开发过程,提高数据处理效率。
  • AI赋能: 通过自然语言交互生成ETL任务和代码,辅助数据处理,实现多轮交互式构建,提升数据处理的灵活性和准确性。


(4)可视化展现:将数据转化为易于理解的视觉形式。

  • 问题: 快速响应业务问题,提供直观的数据结果和结论。
  • AI赋能: 自动根据问题生成SQL、JSON,利用AI生成文字结论、可视化图表和行动建议,实现问答式BI。


(5)交互分析:深入分析数据,生成深度分析报告。

  • 问题: 如何自动化深度分析报告的生成,提供可信的业务分析。
  • AI赋能: 基于BI系统能力,结合企业内部数据源和AI生成的数据指标,自动识别异常原因并用自然语言展示,减少认知偏差(例如波动分析、异常分析和预警)。


(6)决策行动:基于分析结果,提供决策支持。

  • 问题: 如何基于数据分析提供具体的未来行动建议。
  • AI赋能: 提供辅助性预测和基于历史数据的推荐建议,支持数据驱动的决策过程。



支付宝团队在基于蚂蚁集团基础大模型开发研制数据分析智能助理 Deepinsight copilot的过程中,比较系统化地梳理了结合大模型的数据分析智能助理功能需求,划分了不同的智能化等级,非常值得我们参考和学习:


图片


图片

图片

注:

  • CoT即思维链(Chain-of-thought),模仿了一个逐步思考的过程来得出答案。

  • TOT即Tree-of-thoughts,CoT通常只有一条解决问题的路径,ToT等于是CoT的一个拓展,把一条reasoning路径拓展至多条reasong paths,这样模型可以综合多条reasoning path的结果得到最终的结论。

  • ReAct:即Reason和Action,Reason生成分析步骤,Action生成工具调用请求。是目前最常见和通用的增强式语言模型(Augmented LM)范式,它启发于传统强化学习,通过提示词构造“想法”(Thought),“行动”(Action),“观察”(Observation)的思维链, 逐步启发大语言模型根据当前工具的输出产生观察,从而进一步产生下次推理。这种范式被广泛应用在近期爆火的 Auto-GPT 和 LangChain 等项目中。

  • ReWOO 即Reasoning WithOut Observation,通过模块化解耦(Decouple)大语言模型的“预见性推理”(Foreseeable Reasoning) 和工具的执行,从而实现在HotpotQA等任务上数倍的词元效率(Token Efficiency), 并且提高了模型表现以及复杂环境下的鲁棒性。在ReAct中, 指令微调不可避免的会导致小模型“背住”训练集中的工具输出。然而,ReWOO由于将显式的工具输出跟模型的推理步骤分离, 可以因此借由指令微调使其学会具有泛化性的“预见性推理”能力。

  • DAL我没有查到,我估计应该是DSL,即将自然语言转化为特定领域的语言(Domain-Specific Language),也就是我们前面提到的text-to-code。

  • KG即知识图谱,在上一篇文章中正好进行了比较深入的研习。



AI+BI的融合为商业智能领域带来了前所未有的机遇,通过大语言模型的应用,可以极大地提升数据分析的效率、深度和准确性,同时改善用户体验。

作为AI产品经理,理解并把握AI技术在BI产品中的应用,不仅需要技术和业务的深入理解,还需要持续的创新和优化。通过有效地结合AI和BI,我们可以更好地解锁数据的潜力,支持数据驱动的决策,推动企业的智能化转型。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询