微信扫码
与创始人交个朋友
我要投稿
最近几周,我们一起探索了 Text-to-SQL 领域的各种开源项目,从 Dataherald 到 WrenAI,从 DB-GPT 到 Defog,每一个项目都展现了 AI 技术在数据分析领域的巨大潜力。今天,我们将继续我们的 Text-to-SQL 之旅,带你走进腾讯音乐开源的下一代智能数据分析平台——SuperSonic,体验“一句话”数据分析的超快感!
往期精彩回顾
• 开源 Text-to-SQL 工具哪家强?Vanna 让 SQL 小白也能轻松玩转数据分析
• YC孵化的Text-to-SQL未来之星:Defog开源 SQLCoder模型,打造企业级数据分析利
• DB-GPT:蚂蚁开源的Text-to-SQL利器
• WrenAI:开源Text-to-SQL引擎让 SQL触手可及,数据分析的“GPT”时刻来了?
• Dataherald 核心 Text-to-SQL 引擎全面开源!
随着数据分析工具的不断进化,数据分析的门槛正在不断降低。曾经高不可攀的数据分析师,似乎也要面临“失业”的风险?
别担心,这并不意味着数据分析师将被完全取代,而是意味着简单重复的取数工作将被自动化取代,未来的数据分析师需要具备更强的洞察力和决策能力。
ChatGPT 的出现为自然语言交互打开了新的窗口,也为智能数据分析带来了新的可能。试想一下,如果你只需要像和朋友聊天一样,说出你想要的数据,就能立即得到你想要的分析结果,那该多美好啊!
腾讯音乐开源的 SuperSonic 项目正是这样一款致力于打造人人可用的智能数据分析平台的利器!它整合了 Chat BI 和 Headless BI,旨在打造下一代智能数据分析平台,让数据分析像聊天一样简单!
SuperSonic 不仅仅是一个工具,更是一套完整的解决方案,它包含了从数据接入到分析展示的全流程。SuperSonic 的目标是让用户能够以最自然的方式与数据进行交互,无需编写复杂的 SQL 语句,也无需掌握专业的分析技能,即使是没有任何数据分析经验的小白用户,也能够轻松上手,玩转数据分析。
传统的 Text2SQL 方法存在很多局限性,例如难以处理复杂的语义和业务逻辑,生成的 SQL 语句往往存在错误或者效率低下,难以满足大规模实际应用需求。
SuperSonic 的设计初衷正是为了解决这些问题,它采用语义模型的方式,将复杂的业务逻辑封装起来,让用户可以通过自然语言与数据进行交互。
SuperSonic 提供了 Chat BI 和 Headless BI 两种界面,分别面向业务用户和分析工程师。
• Chat BI 界面:面向业务用户的自然语言查询界面,用户可以通过简单的对话完成数据查询和分析,就像使用 ChatGPT 一样简单。例如,你只需要在聊天框中输入“最近一周,哪个渠道的销售额最高?”,SuperSonic 就会立即返回相应的图表和数据。
• Headless BI 界面:面向分析工程师的语义数据模型构建界面,通过构建语义模型,可以将复杂的业务逻辑封装起来,让业务用户更容易理解和使用数据。
• 内置支持多种功能:SuperSonic 内置了对输入自动补全、多轮对话、查询后推荐等功能的支持,进一步提升了用户体验。例如,当你输入“最近”两个字时,SuperSonic 会自动联想出“最近一周”、“最近一个月”、“最近一年”等时间范围供你选择。
• 完善的数据安全体系:SuperSonic 提供了三级数据访问控制机制,可以有效保障数据安全。你可以根据用户的角色和权限,设置不同的数据访问级别,例如只允许查看汇总数据,或者只允许查看特定时间段的数据。
SuperSonic 的强大之处还在于它的可扩展性,它提供了一系列可扩展组件,可以方便地与其他系统进行集成,满足用户多样化的分析需求。
• 知识库:从语义模型中提取模式信息,构建字典和索引,方便模式映射,提高查询效率。
• 模式映射器:识别用户查询中对模式元素的引用,将用户输入与语义模型进行关联。
• 语义解析器:理解用户查询并生成语义查询语句,它是 SuperSonic 的核心组件之一。
• 语义校正器:检查语义查询语句的有效性并进行修正和优化,保证生成的 SQL 语句的正确性。
• 语义转换器:将语义查询语句转换为可针对物理数据模型执行的 SQL 语句,它是连接语义层和物理层的桥梁。
• 聊天插件:使用第三方工具扩展功能,满足用户多样化的分析需求。例如,你可以将数据可视化工具、报表工具、机器学习平台等集成到 SuperSonic 中,实现数据分析、报表生成、模型训练等功能的无缝衔接。
语义模型是 SuperSonic 的核心,它将技术语言翻译成业务语言,将复杂的业务逻辑封装起来,让业务用户更容易理解和使用数据。
SuperSonic 提供了简单易用的语义模型构建工具,你只需要按照以下步骤操作即可:
• 步骤一:创建主题域,对模型进行分类管理,例如“电商数据”、“金融数据”等。
• 步骤二:创建数据库连接,SuperSonic 支持多种常见数据库,例如 MySQL、ClickHouse 等。你只需要在 SuperSonic 中配置数据库连接信息,即可轻松接入你的数据源。
• 步骤三:创建数据模型,SuperSonic 提供了两种创建数据模型的方式:快速创建和 SQL 脚本。你可以根据自己的需要选择合适的方式。
• 快速创建:如果你只想简单地将一张数据库表转化为数据模型,可以选择这种方式。
• SQL 脚本:如果你需要对数据进行更复杂的处理和转换,可以使用 SQL 语句自定义数据模型逻辑,更加灵活。
• 步骤四:创建维度和指标,将数据模型中的字段指定为维度或指标,并可以设置维度和指标的计算方式。例如,你可以将“订单表”中的“订单金额”字段设置为指标,并设置计算方式为“求和”。
• 步骤五:配置连接关系,定义数据模型之间的关联关系,用于多表查询。例如,你可以将“用户表”和“订单表”通过“用户ID”字段进行关联,以便查询每个用户的订单信息。
SuperSonic 让数据分析变得更加简单、高效、智能,每个人都可以成为数据分析师。未来,SuperSonic 将不断迭代升级,为用户带来更加强大的功能和更加便捷的使用体验。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-11
蚂蚁集团基于 Ray 构建的分布式 AI Agent 框架
2025-01-10
我们即将进入 Agentic AI 时代 ,而第一个落地就是 Coding Agent
2025-01-10
2025 AI Agent迷局:谁在玩真的,谁在演戏?
2025-01-10
AGI 通用人工智能模型:基础理论与实现路径
2025-01-09
杨芳贤|AI 2.0时代,如何拥抱与驾驭大模型?
2025-01-09
字节为AI埋下了三条主线
2025-01-09
深度长文|AI的“巴别塔”:多Agent协同为何如此之难?
2025-01-08
独家对话阿里云刘伟光:什么是真正的AI云
2024-08-13
2024-05-28
2024-04-26
2024-08-21
2024-06-13
2024-08-04
2024-07-09
2024-09-23
2024-07-18
2024-04-11