我要投稿

ChatGPT两周年历程回顾及大模型Text2SQL方案索引

发布日期：2024-12-04 12:03:43 浏览次数： 1926 作者：老刘说NLP

今天是2024年12月04日，星期三，北京，天气晴。

今天，我们来回顾ChatGPT两周年历程，并于基于大模型来完成Text2SQL的方案索引。

供各位参考，多思考，多总结，多实践；

一、ChatGPT两周年历程回顾

Chatgpt两周年历程回顾。我们回顾下这段历史，可参考https://baike.baidu.com/item/ChatGPT/62446358：

2018年，OpenAI发布了最早的一代大型模型GPT-1；

2019年，GPT-2发布，模型参数量提高到15亿个；

2020年，GPT-3诞生，参数量达到了1750亿个，其训练参数是GPT-2的10倍以上；

2022年1月，OpenAI对GPT-3用监督式训练进行了微调，并且进行迭代，最终发布了InstructGPT；

2022年11月30日，OpenAI正式发布了ChatGPT，与InstructGPT是姐妹模型，能够对话的GPT版本，是在GPT-3基础上的3.5版本，所以，大家开始用ChatGPT进行对话、写代码等等。

2023年，3月15日，OpenAI正式推出GPT-4，支持多模态；

2024年5月14日，OpenAI推出新旗舰模型GPT-4o；

2024年9月13日，OpenAI发布o1模型，并在ChatGPT和API接口渠道上推出该系列的预览版本OpenAI o1-preview，OpenAI o1包括三个型号，除o1-preview之外还将有o1和o1-mini。

两年后的今天，我们已经已经不习惯没有AI，以AIGC驱动的各种工具越来越多。

二、大模型Text2SQL方案索引

作为第二个问题，我们来看看一个基于大模型方案，一般的流程如下图所示：

从Spider中选取的一个基于大型语言模型（LLM）的文本到SQL的示例。用户提出了一个问题：“哪些卡通片是Joseph Kuhr编写的？”LLM将这个问题及其对应数据库的schema作为输入，然后生成一个SQL查询作为输出。这个SQL查询可以在数据库中执行，并检索到内容“蝙蝠侠系列”，以回答用户的问题。

最近的工作 《Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL》(https://arxiv.org/pdf/2406.08426) 介绍了文本到SQL任务的背景和挑战，然后概述了从传统方法到深度学习方法再到预训练语言模型（PLM）和大型语言模型（LLM）的演进过程。接着，文章详细地介绍了用于评估文本到SQL系统的数据集和指标，并对近期LLM在文本到SQL领域的进展进行了系统性分析。

看几个图：

一个是Text2SQL的整体技术演变进展：

一个是LLM-based text-to-SQL的技术方案层级分类树：

一个是text-to-SQL的流行数据集：

一个是基于ICL示例学习的text-to-SQL方案代表工作

一个是基于SFT微调的text-to-SQL方案代表工作

关于技术路线的选择，都可以基于这些来作为索引查找

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-20

利用AI识别图纸，让图纸处理效率狂飙20倍！

2025-04-19

如何让大模型「读懂」企业数据？——从“单一问数”到“复杂决策”的智能跃迁

2025-04-19

Text-to-SQL准确率破局之道：从基础优化到前沿技术

2025-04-18

破茧成蝶：传统J2EE应用无缝升级AI原生

2025-04-18

Text2SQL 比赛实战心得：从难点到解决方案

2025-04-17

揭秘agent+MCP架构首次落地企业智能数据场景案例

2025-04-17

DataAgent是最容易落地的Agent场景？

2025-04-16

易用+高效+开放！实测卡奥斯智能体：让AI真正懂生产

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文彻底搞懂大模型实战 - 文本到SQL（Text2SQL）

2024-10-14

重磅！Ilya创办人工智能公司SSI：直接迈向安全超级智能

2024-06-20

AIOps在小红书的探索与实践——故障定位与诊断

2024-10-09

DeepSeek如何结合企业应用发挥更大的价值

2025-02-04

万字长文：你必须要读的瑞幸咖啡AI应用战略

2024-06-14

【万字长文】AI智能体驱动未来商业，深度剖析11种AI Agent商业模式

2024-06-16

如何利用生成式AI优化制造企业的生产流程？

2024-06-14

WrenAI-Text-to-SQL：用智能技术解锁数据潜能，助力业务增长！

2024-05-31

腾讯音乐开源的 Chat BI 平台

2024-07-24

DeepSeek：Excel，你已经长大了可以自动处理数据了

2025-02-09

大家都在问

DataAgent是最容易落地的Agent场景？

2025-04-17

工业领域的Manus，为什么是一家杭州公司跑出来了？

2025-04-14

智能体Agent：怎样用自然语言重构数据开发？

2025-04-10

AI和BI的最佳结合方式到底是什么？

2025-04-05

董事长，如果今天你怕错过AI，回想下六年前是怎样怕错过数字化转型的？

2025-03-24

Chat2DB 3.0 发布：SQL 界的 “Cursor”到底有多炸？

2025-03-11

AI Agent会颠覆企业应用软件么？

2025-03-10

效率、机会、挑战，接下来企业在AI时代怎么发展？

2025-03-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部