微信扫码
与创始人交个朋友
我要投稿
在过去二十年里,企业越来越多的依赖于数据驱动的决策,也一直在努力降低数据分析工具的使用门槛,使越来越广泛的用户获得以前只有数据分析师和数据科学家才具备的能力。早在10年前就已经开始有国外的BI平台引入自然语言查询、自动洞察生成、自然语言生成等功能。但是由于技术的不成熟,相关技术和功能一直未得以普及。
大模型的出现极大地提升了BI产品的交互性,ChatBI通过将复杂的数据分析过程简化为用户与机器的对话,使得用户无需具备专业的数据分析技能,也能轻松获取所需的数据洞察,将极大地降低数据分析门槛,提高数据分析的效率和便捷性。
实现ChatBI最核心的技术是Text-to-SQL,旨在将用户的自然语言转化成机器可以执行的SQL,这也是ChatBI最大的技术难点。目前市场上主流的大语言模型能基本理解用户SQL的需求描述,但生成最终可执行SQL的准确率仍然无法达到生产环境的要求。
为了保证最终的ChatBI产品在面向业务用户时可用(即结果足够准确且可信),企业根据自己的数据基础设施现状、技术能力等往往会选择不同的技术实现路线。通过对多个“大模型+数据分析”落地案例的研究,沙丘智库将其中主流的设计思路总结如下:
• 用户以自然语言的方式说出业务需求,大模型①(擅长语义理解)自动对问题作出建议和提炼,提炼后的问题会发送给聊天机器人;
• 聊天机器人使用大模型②(擅长NL2SQL)构建SQL查询,通过提前定义的语义层,完成指标定义、管理、访问等工作,提升数据口径一致性;
• 提取好的数据交由大模型③(擅长总结归纳)处理,生成自然语言回复,同时可视化引擎可输出可视化报表。
注:数据分析工作流的各个环节需要不同的大模型能力,上图所示大模型①、大模型②、大模型③为擅长不同能力方向的大模型能力示意,在实际落地过程中,企业可以选择在同一个大模型上训练多种能力,也可以选择多个大模型,在某些场景下还可以利用大小模型相结合的方式。
沙丘智库长期跟踪调研大模型技术的发展,旨在帮助企业快速了解大模型最新、最全面的落地情况。沙丘智库观察到,各行各业的头部企业基本在2023年下半年开始探索大模型在数据分析场景的应用,到了2024年,企业在“大模型+数据分析”场景的探索进一步加速。总的来看,大模型在数据分析场景的落地还处于早期阶段,未实现大规模应用,但这一场景的增长速度比大多数场景都要更快。
通过研究多家企业ChatBI的落地实践,沙丘智库从金融、制造、零售、IT/互联网等行业精选出8个具有代表性的案例(中国一汽、平安银行、腾讯、京东、星巴克、高露洁、第四范式、哈啰出行)供其他企业进行参考。
中国一汽打造基于大模型的问数助手GPT-BI,相比传统BI的“固定问答”,GPT-BI可以实现问答任意组合,数据随时穿透,满足用户更灵活智能的数据需求,实现“问答即洞察”,带来基于动态因子、实时数据的决策革命。当前GPT-BI覆盖中国一汽研、产、供、销等9大领域指标的查询与分析,包含数据指标实时查询、管理层决策辅助、业务人员高效数据分析三大场景,满足每个角色的数据使用需求。
完整内容:中国一汽GPT-BI应用实践
银行数字化转型过程中数据分析已经成为普遍化的业务需求,传统的数据分析工作需要数据人员开发,通过大模型可以使用自然语言交互取数。平安银行在2023年8月推出基于AI Agent技术的ChatBI,旨在提高业务人员的数据分析能力,消灭“表哥表姐”。
完整内容:平安银行大模型应用实践
腾讯提出了一种新的text2SQL智能问答方案,通过将复杂问题拆解为简单问题,简化了大模型的推理过程,提高了text2SQL的准确性和稳定性,解决生产环境中的实用性问题。
完整内容:腾讯text2SQL智能问答技术实践
京东零售内部打造的ChatBI是一款基于GPT大语言模型的AI数据分析师,旨在通过自然语言对话简化复杂的BI工作。它通过意图识别、实体提取、知识库交互和数据分析应用扩展,为用户提供快速、直观的数据查询和分析服务。ChatBI降低了技术门槛,提高了数据分析效率,使得用户能够像与真人合作一样,轻松解决数据问题。
完整内容:京东零售数据分析场景大模型实践
业务部门当前数据洞察的流程较长,需要提出数据需求给数据部门,数据产品部门对数据进行梳理后交给数据执行部门执行,执行后再将结果转交给业务部门,整个流程最快也需要2-3天。因此,星巴克探索NL2SQL,协助业务部门快速执行业务洞察。
完整内容:星巴克大模型应用探索
高露洁正在试点一个生成式AI驱动的数据分析机器人,旨在实现数据民主化,加快数据洞察。通过将虚拟货架的数据分析与内容创建结合起来,该工具收集有关定价、库存水平、产品详情页内容、搜索位置、评级、评论、竞争对手分析的数据;员工可以对话询问机器人有关数据的问题,例如“薄荷美白牙膏的销售额是多少?”,还可以检索缺货数据,如产品层面的缺货频率和缺货持续时间。
案例选自:《2024年生成式AI案例研究简报(6月)》
第四范式基于“NL2Mertric”的思路解决Text-to-SQL在业务场景落地时存在的数据不一致、业务不可信、成本不可控难题,增加了语义化数据建模层。
基于语义模型的ChatBI流程架构如下:
完整内容:第四范式基于语义模型的ChatBI实践
哈啰基于DSL实现BI助手,DSL本身定义了指标、维度、表、查询日期。基于DSL的BI助手生成的稳定性更强,如果不能准确生成相关的报表分析则拒答,目前拒答率是30%,一旦生成准确率接近100%。
完整内容:哈啰出行大模型业务提效实践
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-18
RPA与AI的结合:变革业务自动化的协同效应丨AI时刻
2024-11-18
替代 NL2SQL,Agent+业务语义的创新产品设计
2024-11-16
腾讯分析型 BI+AI 产品 OlaChat 创新探索
2024-11-12
国产 BI 的“耻辱”:QuickBI 的“后发优势”(删改版)
2024-11-12
让数据分析像聊天一样简单|观远ChatBI来了
2024-11-12
量化投资4.0:利用自动化、可解释和知识驱动的人工智能进行工程化量化投资
2024-11-12
电厂 | 引入正版论文库,知乎拿到了一张AI搜索的好牌
2024-11-11
大模型时代,BI系统的演化方向
2024-06-20
2024-07-03
2024-06-14
2024-06-06
2024-06-14
2024-06-21
2024-06-16
2024-06-07
2024-07-21
2024-07-01