微信扫码
与创始人交个朋友
我要投稿
分阶段处理流程:ChatBI采用了一个创新的分阶段处理流程,该流程首先使用大型语言模型(LLMs)生成JSON格式的中间输出,然后将这些输出传递给BI中间件(如Apache SuperSet),以展示结果。这种方法与传统的直接依赖LLMs生成SQL的方法不同,它仅依赖于生成JSON。
复杂性解耦:通过将问题分解,ChatBI避免了LLMs直接处理SQL中的复杂语义、计算和比较关系。相反,LLMs只需要理解如何将这些复杂关系映射到JSON所需的输出。这种解耦方法简化了任务,提高了LLMs生成JSON的准确性。
虚拟列(Virtual Columns):ChatBI引入了虚拟列的概念,以处理那些需要从其他列计算得出的列,如“DAU”。虚拟列通过其对应的键(列名)来访问计算规则,这些规则存储在JSON中,称为JnM(Json nested Map)。这种方法允许LLMs生成包含复杂计算步骤的查询,同时提高了查询生成的效率。
模板和规则:在新的处理流程中,Apache SuperSet使用通用模板来生成SQL。LLMs生成的JSON输出充当填写这些模板的占位符,最终输出SQL。这种方法利用了数据库社区对基于维度和列生成SQL的广泛研究。
SRD数据集和MRD数据集介绍。主版本和轻量版本对应不同的应用程序。DAU代表日活跃用户,新用户指首次注册的用户。
Towards Natural Language to Complex Business Intelligence SQLhttps://arxiv.org/pdf/2405.00527
大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-07
解锁AI编程:VSCode轻松接入Deepseek大模型
2025-02-06
谷歌发布Gemini 2.0 Pro:综合评测超DeepSeekV3略低于DeepSeekR1,支持200万输入!开发者当前免费
2025-02-06
TI-ONE时间 | 全网最详细DeepSeek部署操作指南
2025-02-06
谷歌反击,最强Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台
2025-02-06
DeepSeek R1 给我的冲击
2025-02-06
大模型涉及到的精度有多少种?FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8都有什么关联,一文讲清楚
2025-02-06
“AI三杰”都是广东人,为何都没在广东发展?
2025-02-06
Google Gemini 2.0 Pro来袭,DeepSeek突然觉得不香了?
2024-08-13
2024-09-23
2024-06-13
2024-05-28
2024-08-21
2024-04-26
2024-08-04
2024-07-09
2024-07-01
2024-09-17
2025-02-06
2025-02-06
2025-02-04
2025-02-01
2025-02-01
2025-02-01
2025-02-01
2025-01-29