AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


“大模型+数据分析”价值可期,但当前仍存在落地难点
发布日期:2024-06-21 07:35:44 浏览次数: 2480 来源:沙丘社区


在数字化转型的背景下,数据分析能够将海量的数字信息转化为洞察力和行动力,帮助企业在日益激烈的市场竞争中做出精准决策,优化运营效率,提升客户体验,并发掘新的增长点。通过对数据的分析,企业能够更好地理解市场动态、预测消费者行为、创新产品和服务,以及实现资源的最优配置,从而在数字化浪潮中保持领先地位并实现持续发展。

在过去二十年里,企业越来越多的依赖于数据驱动的决策,也一直在努力降低数据分析工具的使用门槛,使越来越广泛的用户获得以前只有数据分析师和数据科学家才具备的能力。早在10年前就已经开始有国外的商业智能平台引入自然语言查询、自动洞察生成、自然语言生成等功能。但是由于技术的不成熟,相关技术和功能一直未得以普及。

大模型用于增强数据分析的优势
大模型的出现将进一步改善用户的数据分析体验、采用和影响,使得“数据分析平民化”这一理念成为现实。将大模型用于增强数据分析的优势非常明显:

第一,自然语言处理和理解。大模型能够以接近人类的水平理解和处理自然语言,能够帮助用户更快速、更准确地解析和理解大量的非结构化数据,例如文本数据、用户评价、社交媒体内容等。

第二,自然语言交互形式。非技术人员能够通过自然语言查询获取所需数据和分析结果,同时提供清晰的数据解释和可视化,帮助用户更好地理解分析结果和数据洞见。

第三,识别模式、相关性和关系。大模型擅长在大量数据中揭示复杂的关联,能够基于现有数据进行智能推理和预测,这种能力对于准确预测市场趋势和理解消费者行为至关重要。例如,通过分析历史销售数据来预测未来销售趋势。

第四,代码生成和自动化。大模型能够自动生成代码,帮助数据分析师快速创建数据处理和分析的脚本,可以显著提高数据分析的效率和准确性,同时降低数据分析的门槛,使得非技术背景的人员也能够进行数据分析。

第五,支持自动化和实时分析。大模型通过自动执行重复、耗时的任务来简化数据处理。因此,提高员工对数据结果的反应效率。这一功能可进行实时分析,为企业提供及时的数据洞察,可以快速灵活的应对市场变化。

第六,数据处理的可扩展性。大模型能够高效地管理和分析日益增长的大型数据集,对于数据量高速增长的企业至关重要。这种可扩展性确保了一致的性能和从大量信息中提取洞察的能力。

大模型的企业落地现状
根据沙丘智库长期在大模型领域的跟踪调研,发现各行各业的头部企业基本在2023年下半年开始探索大模型在数据分析场景的应用。例如:
• 在金融领域,平安银行在2023年8月推出基于AI Agent技术的ChatBI,旨在提高业务人员的数据分析能力,消灭“表哥表姐”;
• 在制造领域,中国一汽从2023年9月份开始探索GPT-BI落地应用,目前GPT-BI已经成功应用很多经营决策场景,准确率也从实验室阶段的20%上升至90%,逐渐成为各层级各角色的智能辅助助手。GPT-BI也是中国一汽首款大模型落地应用;
• 在零售领域,高露洁在2023年8月试点生成式AI驱动的数据分析机器人,将虚拟货架的数据分析与内容创建结合起来,旨在实现数据民主化,加快数据洞察。
到了2024年,企业在“大模型+数据分析”场景的探索进一步加速。
虽然价值可期,但如何将大模型能力很好地融入到企业的现代数据堆栈、数据管道和数据分析工作流程中,是企业落地“大模型+数据分析”时面临的难题。例如,近期沙丘智库对泰康集团的调研发现,泰康集团在实践后认为直接用大模型实现NL2SQL还不可行,在数据分析场景,泰康集团目前主要是将大模型用于意图理解、追问等。

大模型+数据分析的设计思路

学术界和产业界对NL2SQL技术的研究从未停止,在《如何实现基于大模型的ChatBI?一文读懂Text-to-SQL技术路线》中,沙丘智库梳理了NL2SQL在不同阶段的代表性工作,帮助大家更好地理解和应用这项技术。
当前,不同企业根据自己的数据基础设施现状、技术能力等采取了不同的“大模型+数据分析”设计思路。通过对多个“大模型+数据分析”落地案例的研究,沙丘智库将其中主流的设计思路总结如下:


• 用户以自然语言的方式说出业务需求,大模型①(擅长语义理解)自动对问题作出建议和提炼,提炼后的问题会发送给聊天机器人;

• 聊天机器人使用大模型②(擅长NL2SQL)构建SQL查询,通过提前定义的语义层,完成指标定义、管理、访问等工作,提升数据口径一致性;

• 提取好的数据交由大模型③(擅长总结归纳)处理,生成自然语言回复,同时可视化引擎可输出可视化报表。

注:数据分析工作流的各个环节需要不同的大模型能力,上图所示大模型①、大模型②、大模型③为擅长不同能力方向的大模型能力示意,在实际落地过程中,企业可以选择在同一个大模型上训练多种能力,也可以选择多个大模型,在某些场景下还可以利用大小模型相结合的方式。

这种对话式的数据分析可以让用户以自然语言进行数据查询,还可以与数据可视化功能相结合,为任何用户(即使是非技术人员)赋予与数据交互的能力。而且当与图形生成功能结合使用时,可以改变用户的分析体验,简化数据和分析工作。

数据查询的效率和准确性很大程度上取决于数据的质量和完整性,但大部分企业的数据分散在各种系统中,企业在数据方面的基础设施还无法支持完整对话式数据分析的实现。因此,企业应该尽快加大对数据管理的投资,使大模型可以轻松集成所需的企业数据。企业应做好数据认责、确权、口径、定义等工作,保证数据资产目录清晰,有助于模型理解数据资产,使大模型在理解业务勾稽关系时更靠谱。

大模型+数据分析的落地考虑因素

目前大模型在数据分析场景的落地目前还处于早期阶段,未实现大规模应用,但这一场景的增长速度比大多数场景都要更快。为了获得更好的投入产出,企业在探索这一场景之前,需要明确以下问题:

• 用户:谁将使用数据分析工具?主要是面向专业的数据分析师团队,还是面向更多数据能力相对较弱的普通用户?

• 行业要求:根据企业所在行业的政策和监管要求,企业使用的数据分析工具是否需要符合特定的法律法规?例如对于出海企业,使用的工具如果涉及到数据跨境传输需要格外谨慎。

• 跨部门用例:哪些部门将使用数据分析工具?该工具是否适用于企业的所有用例?

• 数据洞察量:计划每天、每周和每月产生多少数据洞察?

• 数据展示要求:需要向谁展示数据洞察结果?是否需要以特定的仪表盘或可视化方式展示结果?展示结果的频率如何?

• 速度:需要多快的生成洞察?

• 准确性:企业可以接受的数据分析结果准确率是多少?

• 培训:员工需要接受多少培训才能有效使用该工具?

明确以上问题有助于帮助企业建立相关的关键绩效指标,并选择最佳的数据分析工具和技术路线来实现这些目标。




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询