AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


LLM+数据分析,大模型的一个攻坚领域市场观察
发布日期:2024-12-16 07:31:01 浏览次数: 1606 来源:数据技术和数字化转型


如题。

为什么说AI+BI是大模型的攻坚领域呢?

实际上很多业内人士已经意识到了,目前主要的大模型应用落地技术、产品、应用都是关于非结构化数据的,比如写个文档,总结个纪要,查询众多PDF、Word、WPS、邮件等不同格式文档中的信息等等。

但在大模型出现之前,上面说的这些“数据”很多都归入企业的“暗数据”或“隐数据”(周鸿祎当初有个直播里对此进行了区分,具体大家可以找找,但不影响这里的理解),而那时候大部分企业中最大块的数据资产是结构化数据,还有一个类似概念叫表数据(Tabular Data)。

其实大模型技术兴起后,结构化数据依然是企业内价值最大的数据资产。尽管大模型的确比较擅长处理非结构化数据,但是在确定性的生产级应用场景落地之前,非结构化数据还没有能够被真正低成本和高效的利用起来,对原有结构化和非结构化数据的价值认定情况就依然不会改变

大模型在结构化数据的理解、处理和知识抽取方面的基础能力还不够。从底层技术逻辑看,大模型技术是以“相似”取胜,但实际上并非基于“理解”语义,这对于非结构化数据和高容错场景是可行的,但在元数据驱动的结构化数据世界是差好几口气的;从效果看,即使是最先进的GPT-4o裸模型在处理结构化数据分析类任务时的表现也是非常不ok的;从成本看,将海量结构化数据以及后续的查询交互所耗费的token也是较高的。

所以,大模型+结构化数据的数据分析是一个攻坚的市场。但是一个必须的、有价值的攻坚市场

大模型+数据分析有不同的产品形态,粗略的说可以分为

  • 大模型+报表:包括简单表格生成,这个国内外主流类ChatGPT产品都可以做了,稍微复杂一点的,比如需要多表融合或中国式报表处理的就得归到下一类了

  • 大模型+BI:这是目前比较主流的市场和产品形态,也是因为原有的数据分析市场中BI是一种较通用的产品形态和广为市场接受的概念。大模型之前就有AI+BI的概念(也有叫ABI的,但之前还有一个版本叫Advance BI或Augmented BI,看古早材料的时候注意区分)

  • 大模型+专门数据分析工具:大多数企业级OLAP应用都是这一类,比如风控、监管、审计、运营分析等等,大家都是围绕一堆业务指标开展计算和分析,但不同领域,以及不同行业的工具长的样子都不同。


所以,LLM+BA市场大有可为。

那么这个市场目前都谁在做,做的产品如何呢?

在这里借用国内BI市场做的比较好的帆软的一个官方blog文章来看一看。(https://www.finebi.com/da/wdsbiy)

这个被帆软称为“对话式BI”的市场,也常被称为ChatBI或智能BI,也就是本文前面提到的LLM+BI类型,是LLM+BA的一个重要子领域。我们从这个对比中大致可以看出ChatBI市场的以下几个要点:

  1. 核心能力包括多轮对话和意图理解能力,高级分析能力以及与底层BI工具结合的能力等

  2. BI市场的在位者(既有厂商,incumbents)出于自身的优势地位和既有利益,非常强调LLM+BI这种新产品与传统BI产品的可比性以及连接能力,如指标管理、灵活查询、看板组件等

  3. NL2SQL,知识库接入,精调微调等能力仍是ChatBI类产品的难点,尤其是NL2SQL,在大模型能力进一步提升之前,厂商的主流方案还是次优的NL2MQL/NL2DSL等等,实际上更加厂商锁定,也没有真正解决泛化的问题,不是期望的智能效果

  4. 支持本地化部署、支持钉钉、企微等协作APP集成、支持大模型自定义接入等也是在国内落地一些比较重要的考虑因素。


虽然BI市场的在位者有其既定的优势,但ChatBI不是大模型+数据分析市场的全部。对于LLM+BA这个领域而言,可能所有的厂商都是新进入者。大模型+数据分析市场大有可为。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询