AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


数据分析 Agent 在零售和金融领域的解决方案与落地应用

发布日期:2025-03-10 18:26:24 浏览次数: 1537 来源:DataFunSummit
推荐语

了解数据智能分析在零售和金融领域的应用,洞悉企业如何高效利用数据。

核心内容:
1. 企业在数据分析中遇到的挑战与难点
2. 大模型+数据分析技术路线的对比分析
3. Data Agent 在企业级产品中的应用与设计思路
4. 零售和城商行领域的最佳实践案例分享
5. 数据分析未来发展方向的展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

导读 随着数字化浪潮的推进,数据已成为企业发展的核心资产。在零售和金融等行业,如何高效地利用数据进行精准分析,进而驱动业务增长,成为众多企业关注的焦点。Data Agent 作为数据智能分析的新兴力量,正逐渐改变着企业的数据分析模式。本次分享将深入探讨 Data Agent 在零售和金融领域的应用,为企业解锁数据价值提供新思路。

今天的介绍会围绕下面五点展开:

1. 企业数据分析与洞察的难点与挑战

2. 大模型+数据分析的常见技术路线对比

3. 企业级 Data Agent 产品设计思路

4. 最佳实践分享:零售消费&城商行案例

5. 发展方向展望:大模型+数据分析未来发展方向

分享嘉宾|岑润哲 数势科技 数据智能产品总经理

编辑整理|段志成

内容校对|李瑶

出品社区|DataFun


01

企业数据分析与洞察的难点与挑战

在当今数字化时代,数据已成为企业发展的关键驱动力。众多企业纷纷组建数据团队和分析师团队,期望从海量数据中挖掘有价值的信息,为决策提供有力支持。然而,在实际操作过程中,企业级数据分析面临着诸多痛点。

  • 数据提取的痛点

数据提取工作主要依赖专业分析师,他们需撰写 SQL 语言进行大量数据查询操作。对于非技术人员而言,SQL 的复杂性使得数据获取门槛颇高,导致许多时间浪费在学习查询语言上,而非专注于数据洞察和业务行动。这种依赖专业人员的模式不仅效率低下,也难以满足业务快速发展对数据的需求。

  • 数据分析的痛点

企业依赖 BI 工具实现数据可视化,但 BI 报表配置难度较大,每次配置数据集和报表都需要技术团队介入,这无疑增加了沟通成本和时间成本。业务人员在使用过程中,往往会因报表配置的复杂性而感到沮丧,影响了数据分析的效率和效果。

  • 数据洞察与总结的痛点

分析团队常常需要花费大量时间将数据导入 Excel 进行整理和分析,这种重复低效的工作模式限制了对数据的快速反馈能力。从数据中提取有价值的洞察并形成可执行的结论变得异常困难,使得数据分析难以真正为业务决策提供及时有效的支持。

许多企业采用数据仓库加 BI 工具的模式,由专业分析师为业务团队服务。但随着业务的快速发展,业务团队的需求呈指数级增长,而专业分析师的招募和培训速度相对较慢,导致供需失衡。这种传统模式已难以满足企业对数据快速、高效分析的需求。

为解决这些问题,我们期望借助大模型的能力,结合企业已构建的指标语义层,降低数据使用门槛,让企业内部的数据消费者,即数据公民,能够更高效地利用数据。通过这种方式,推动数据民主化进程,提升企业日常经营决策的效率。

新的数据消费范式可分为三层,底层为数据仓库、数据湖等数据存储层;中间层是指标语义库,将企业内部的指标、标签和维度进行业务化抽象,作为连接大语言模型和底层数据库的桥梁;上层为用户体验层,为业务方提供类似聊天框的工具,用户通过自然语言发出请求,大模型将需求转化为相应的指标、维度或时间要素,进而进行底层查询。

02

大模型+ 数据分析的常见技术路线对比

从技术角度来看,实现大模型与数据分析结合主要有三条路径,分别是自然语言转 SQL(NL2SQL)、自然语言转 Python 代码(NL2Code),以及自然语言转语义层(NL2Semantics)。这三条路径在实现方式、优缺点等方面存在差异。

1. 以 BI 平台为核心的 NL2SQL 或 NL2Code 路线

该方式利用大模型生成代码的能力,用户进行自然语言查询时,大模型依据底层数据库的表结构和专业逻辑,直接生成 SQL 语句或 Python 代码,然后交给企业级数据库执行对数据的操作。这种方式的优点是简单快捷,能在一定程度上满足基本的数据查询需求。

然而,在实际应用中,存在诸多问题。在企业级数据查询场景中,涉及大量表格时,其准确率仅约 60 - 70%,即使是先进的 GPT 模型也难以直接提供准确结果。预训练大模型对企业客户数据与数据格式定义的掌握不足,当数据源过大时,学习表结构的成本较高。大模型写出的 SQL 未经优化,可能导致长查询占比较多,性能不佳,甚至引发查询服务异常,多表关联查询时性能更不可控。大模型直接对接数据查询,缺少数据权限管控,存在较高的隐私与安全风险,用户可能获取非权限内的数据。很多高级分析问题依赖底层引擎能力,大模型生成 SQL 难以满足这些复杂需求。

2. 以指标平台为核心的 NL2Semantics 路线

鉴于 NL2SQL 或 NL2Code 的弊端,我们提出在大模型和底层数据仓库之间加入一层语义层。构建语义层的原因在于底层数据库逻辑复杂,大模型难以直接理解,而语义层可以像桥梁和翻译器一样,将复杂的数据库逻辑与指标维度进行映射,使大模型能将用户需求转化为相关分析范式。

这种方式具有诸多优势。查询的指标可信,进行财务分析时,能确保成本、利润、收入等指标与企业标准指标一致。计算过程中有预聚合操作,可保证前端查询的效率和时效性。每个指标都能进行严格的行列级管控,例如根据用户角色对上海和北京用户关于销售额的查询进行指标级过滤,更精准地提取数据。在处理复杂问题时,先构建好指标语义层,再借助大模型和 Agent 架构解析复杂任务意图,这种技术路线对于不同类型问题的处理能力更强,能够满足企业内部不同角色在不同场景下的复杂任务需求。

构建数据语义层需要具备七个要素,包括明确语义模型,界定哪些字段是指标、哪些是维度;针对底层指标,判断是否需要进行多维 OLAP 计算以提高查询效率等。当这些能力具备后,语义层即可成为连接用户自然语言和底层数据库数据语言的重要连接器。

以用户提问 “帮我看一下最近七天的销售额,并且做一个趋势分析,以及帮我做一个解读” 为例,大模型首先进行任务规划,将该问题拆解为取数、趋势分析和解读等子任务。然后,大模型将每个子任务涉及的指标或维度在语义层进行映射,由于语义层中每个指标和维度都有标准定义,此时大模型并非直接生成 SQL 逻辑,而是进行 SQL 片段的召回和拼接,从而大幅提高准确率。接着,将任务交给 OLAP 引擎执行,得到结果明细表。对于时间序列数据,借助小模型进行趋势分析或预测。最终,将结果以自然语言报告或摘要的形式呈现给用户。

通过对比 NL2SQL 和 NL2Semantics 在不同数据分析场景的实现度可以发现,在简单查询场景中,两者都可实现,但 NL2Semantics 更准确;在复杂查询场景,如跨表多指标查询、多维归因和报告解读等,NL2SQL 难实现或实现效果不佳,而 NL2Semantics 不仅可实现,且结果准确、易于理解。

我们可以将数据分析的需求分为四类,其中最基础的数据查询的需求是数量最多的,但价值相对较低;在查询基础上进行统计分析,进而洞察深层原因,甚至给出决策建议才是更有价值的工作。

我们采用 Agent 架构实现复杂意图的识别。首先对用户 Query 进行拆解,之后将不同的子任务与不同的 API 对齐,进行 workflow 的编排。

以某线下零售行业客户的场景为例,用户提出“帮我做个经营复盘”,如果将问题直接提给大模型,大模型并不会根据企业自身的数据进行分析。以 Agent 架构实现,即可沉淀企业内部分析师的分析思路。这时该问题就会被拆解成四个任务,首先是提取明细数据,即按区域查询上月订单量和月环比情况;接着进行排序,找到最差的区域;第三步归因分析,找到环比下降的原因;最后将结果给到大模型,生成报告。

在数据洞察中,还可以结合非结构化数据和外部信息,更好地进行归因分析。

将通过自然语言获取到的数据集变为易于理解的结论和建议,对业务方而言才更有意义。

03

企业级 Data Agent 产品设计思路

基于上述技术路线的分析,我们提出企业级 Data Agent 产品设计思路,其中包含 Query Agent、Insight Agent 和 Report Agent,它们相互协作,共同实现数据从提取到洞察再到报告生成的全流程处理。

1. Query Agent

Query Agent 主要解决数据提取的问题,负责将用户的自然语言请求转化为对数据源的查询操作,从数据源中获取所需的数据,并将其转化为数据表的形式,为后续的分析提供数据基础。

2. Insight Agent

Insight Agent 的核心任务是将数据转化为有价值的洞察。它基于 Query Agent 获取的数据,进行深入分析,包括趋势分析、归因分析、排名分析等。例如,对于时间序列数据,发现某一天指标出现问题,趋势下降;或者发现某类商品销量存在问题,并进行归因分析;又或者对比不同分支行的业绩,发现某些分支行业绩下滑,进行排名分析等。这些洞察为企业决策提供了重要依据。

3. Report Agent

Report Agent 负责将 Insight Agent 产生的洞察转化为人类可读的报告,并提取最重要的结论。大模型在这方面具有强大的能力,可以将大量洞察总结为精华摘要并输出结论,为企业管理团队提供直观、易懂的决策支持。

4. Multi-Agent 交互

当用户提出需求时,这三个 Agent 会进行 Multi-Agent 交互。以用户说 “帮我做一个业绩复盘” 为例,Report Agent 会告诉 Insight Agent 需要进行哪几种洞察分析,Insight Agent 再告诉 Query Agent 为了实现这些洞察需要获取哪些数据集或数据匹配操作。通过这种协作方式,将实际的数据源逐步转化为最终的报告或洞察,满足用户的复杂需求。

04

最佳实践分享:零售消费 & 城商行案例

1. 某头部城商行企业智能数据分析产品应用案例

某头部城商行在数据分析方面面临诸多痛点。数据查询效率低,数据需求无限而开发资源有限,导致需求排队严重;指标归因慢,主要依赖分析师人工在 BI 工具或 Excel 中进行维度与因子下钻,手工挖掘洞见,效率低下;数据解读靠人工,领导面对大量表格难以快速获取结论,想直接知道哪些指标出了问题。

针对这些痛点,数势科技为其打造了企业级数据分析助手。该助手上线后,取得了显著成效。满足了领导们关于净收入分析、贷款存款、同业负债等核心指标的查询场景,领导群体大概有几十人,累计 1200 条查询需求,从问询到结果输出基本能在 5 秒之内完成,经分析,他们提出的问题中 90% 以上都能通过该助手满足并实现。

在项目实施过程中,首先面临需求错配问题,总行分析师仅有大概 20 人,但有上千号业务人员和领导有日常取数需求,通过优化流程和技术手段提升团队效率。其次,解决指标语义口径定义混乱的问题,通过构建语义层,统一指标定义和口径。

整体架构如上图所示,基于企业数据源和基座大模型,构建统一的指标语义层,并在此基础上提供交互式的数据分析助手。

在场景应用方面,初期围绕分支行业绩对比这个场景进行实施和输出,让领导们先使用起来。第二期针对业务团队,如对公贷款团队、零售客户信用卡分析团队等,满足他们通过自然语言进行详细分析和深入挖掘的需求,并进行了相应实施。

以银行业客户逾期情况数据查询场景为例,SwiftAgent 中有预制好的问题模板和定义好的指标,通过大模型将自然语言解析成指标和标签语义,避免了自然语言直接生成 SQL 导致的数据查询准确率低的问题。用户可以查询特定时间段内逾期客户占比和逾期客户数,并进行可视化趋势分析,还能对逾期客户进行不同维度的归因分析,如具体到某时间段内逾期客户占比的变化趋势,通过因子分析找出影响因素,对相关维度进行下分分析,查看不同行业、省份客户量的变化情况,最后生成完整的解读报告,包括整体的指标变化情况、影响的因子和维度有哪些,并将具体的情况以鱼骨图展示。同时,基于丰富的行业经验,帮助客户建立完整的指标体系,每个指标都保证口径统一,方便用户查询指标的基础信息,通过计算血缘关系清晰展示指标的数据来源,实现数据的追踪溯源,确保准确。用户也可以通过移动端,在任何场景都能以自然语言的形式进行数据查询、数据归因分析以及报告查询等功能。

上图中展示了落地实践的路径。

2. 某头部门店连锁企业智能数据分析产品应用案例

第二个案例来自某头部门店连锁企业。

在原有数据仓库的基础上,数势科技利用自身的大模型数据分析产品帮助其构建了一套完整的指标体系框架,并打造了一套供管理团队和门店一线业务人员使用的数据分析助手。

连锁门店的核心痛点在于,对上,需要汇总数据日报,人工繁琐撰写与总结;对下,定期需要进行数据分析,并纯人工进行基于数据指标与知识库的复盘。每个督导人员平均管理四十家门店,且每个门店表现各异,导致报告难以个性化撰写。

数势科技为其打造的产品旨在通过产品帮助这些门店加盟商的督导实现更智能化的门店运营分析。

项目主要分为几个阶段:第一个阶段是整合语义层,为了让大模型更好地理解指标体系,前期提供资源服务,梳理了财务域、门店域、商品域以及供应链的一些指标,构建了体系化的指标框架;第二个阶段,基于构建好的指标体系,借助大模型助手助力用户理解门店的业绩表现。

以门店管理域和门店运营域的指标体系为例,构建完成后,让大模型理解这套体系。

一线门店的店长或管理人员在日常工作中可以进行多项操作:首先,可以进行目标分析和同店对照分析,查看自己管理的门店业绩考核 KPI 是否达标,哪些门店表现不佳;还能结合知识库,查询门店地址等信息,并对 KPI 未达成的原因进行深度分析,也就是归因能力;此外,针对不同的问题指标,还能为加盟商提供建议。比如产品品质合格率不高时,系统不仅能告知加盟商合格率存在问题,还能从 ABC 三个视角给出下个月的优化方向。这就实现了从数据分析到输出行动方案的连接,而不是仅仅给加盟商一个 Excel 表。

例如,店长想了解门店毛利较低的原因,首先会进行数据提取,得到明细表;然后拿着明细表询问大模型毛利出现问题的原因,通过归因分析能力,判断可能是某个商品成本出现问题导致毛利波动;最后,基于这些根因分析结论,为店长或加盟商的督导输出完整报告,明确指出问题所在,并给出后续优化策略调整建议,帮助提升门店经营水平。

05

发展方向展望:大模型 Agent + 数据分析未来发展方向

在为客户服务的过程中,我们发现当前 Data Agent 或其他 Agent 工具大多是用户主动提问的模式,这对用户的提问能力有一定要求,且在实际使用中,业务用户,尤其是领导,不太清楚针对企业指标该如何提问。为此,我们进行了一项优化,除了让用户主动对企业内部指标体系或分析体系提问外,还让系统主动帮助用户发现问题。

例如,之前服务的一家银行有两千个指标,对于业务方或领导而言,很难每天清楚该关注哪个指标、哪个维度。所以,我们让系统先从两千个指标中分析出可能存在问题的指标,例如告知领导对公贷款的某个指标近期下降了 10% 或 5%,提醒领导关注,这是第一步;接着,大模型基于这个问题生成相关问题,比如建议领导从分支行、业务部门或业务线等视角查看;领导基于这些推荐问题深入洞察,要求工具从特定视角进行归因分析,进而进入多维取数、归因分析等后续步骤,最后以报告形式呈现给领导。

在未来发展过程中,我们认为系统本身可以主动为用户生成问题、发出指标预警。这种方式既可以提升系统的交互体验,又可以降低用户主动思考问题的难度,能让工具更好地服务企业,提高企业数据分析的消费效率。例如,系统可以实时监测数据指标波动,当发现 “对公贷款余额” 出现指标异动时,及时通知领导进行关注,并进一步提供多维度分析、归因分析,帮助领导快速了解情况,做出决策。

本次分享围绕企业数据分析的痛点、技术路线、产品设计、实践案例以及未来发展方向,对数科科技在零售和金融行业的 Data Agent 解决方案进行了深入剖析。通过构建指标语义层、采用多 Agent 协作架构以及引入大模型能力,Data Agent 为企业提供了高效、智能的数据分析服务。未来,随着技术的不断进步,Data Agent 将朝着主动式、智能化方向发展,为企业创造更大的价值。
以上就是本次分享的内容,谢谢大家。

图片

图片

分享嘉宾

INTRODUCTION


图片

岑润哲

图片

数势科技

图片

数据智能产品总经理

图片

岑润哲,现任数势科技数据智能产品总经理,前头部互联网公司资深量化运营负责人,多年零售与金融行业数据挖掘与用户运营策略设计经验,曾为多家大型企业搭建从目标设定、数据诊断、策略设计到优化复盘的全链路数字化运营平台

活动推荐

往期推荐


lceberg 助力 B 站商业化模型样本行级更新的实践

「韩国本土电商」AI训练效率提升实践宝典

网易伏羲基于LLM的游戏智能交互应用实践

AutoMQ Table Topic:基于 Iceberg 构建流式数据湖新范式

突破数据I/O瓶颈!唯品会缓存方案大公开

从传感器到智能决策:数据驱动企业发展与ESG创新的全链路实践

李继刚:Prompt的道与术

跨境电商标配!AI训练加速新范式

华为诺亚解析:推荐系统的技术演进及大模型应用实践

「日本电商巨头」亲测:数据平台灵活性和扩展性提升术

点个在看你最好看

SPRING HAS ARRIVED

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询