我要投稿

漫画大模型简史

发布日期：2025-01-23 05:07:58 浏览次数： 1767 作者：AI大模型世界

时间的从1943年说起，沃伦·麦卡洛克（Warren McCulloch）和沃尔特·皮茨（Walter Pitts）提出了人工神经元模型，也就是阙值逻辑单元（TLU），这是神经网络研究的基础。

就是下面这两位大神，意外的发现尽管相差25岁，竟然同一年去世...

而 Pitts 竟然是一位非常非常 i 的人，i 到哪怕给钱都不愿意让别人知道名字的地步...

而 TLU 长下面这样：

1950年：图灵发表了《计算机器与智能》，提出了著名的“图灵测试”，即如果一台机器能在对话中让人类无法判断其是否为机器，则这台机器具有智能。标志着人工智能概念的萌芽。

1956年：在美国达特茅斯学院，由约翰·麦卡锡（John McCarthy）、马文·明斯基（Marvin Minsky）等人组织的会议上，首次提出了“人工智能（Artificial Intelligence）”的概念。

这次会议被认为是人工智能作为一门独立学科的正式诞生。

1959年：亚瑟·塞缪尔（Arthur Samuel）开发了世界上第一个自学习程序——西洋跳棋程序，引入了"机器学习"这个术语。

1966年：约瑟夫·魏岑鲍姆（Joseph Weizenbaum）开发了ELIZA，这是一个早期的自然语言处理程序，能够模拟心理治疗师与人对话，揭示了机器与人类自然语言交流的可能性。

1969年：马文·明斯基（Marvin Minsky）和西摩·帕珀特（Seymour Papert）出版《感知器》一书，指出了单层神经网络的局限性，单层神经网络也存在一些局限性。例如，单层神经网络也存在一些局限性。例如，感知器模型只能解决线性可分问题，对于非线性可分数据则无法进行有效分类, 导致神经网络研究一度停滞。

第一次寒冬降临

1982年：约翰·霍普菲尔德（John Hopfield）提出霍普菲尔德网络，重新激发了对神经网络的研究兴趣。

1986年：大卫·鲁梅尔哈特（David Rumelhart）等人重新引入了反向传播算法，推动了多层神经网络的研究。

1989年：杨立昆（Yann LeCun）应用卷积神经网络于手写字符识别，这是深度学习在实际应用中的早期成功案例。

2006年：杰弗里·辛顿（Geoffrey Hinton）等人提出了深度信念网络（Deep Belief Networks），为深度学习奠定了基础。

2012年：杰弗里·辛顿的指导下，亚历克斯·克里泽夫斯基（Alex Krizhevsky）开发出AlexNet模型，在ImageNet图像识别竞赛中取得了显著的成绩，推动了深度卷积神经网络的发展。

2014年：伊恩·古德费罗（Ian Goodfellow）提出了生成式对抗网络（GAN），为生成模型开辟了新方向。

2017年：论文《Attention Is All You Need》提出了Transformer架构，革新了自然语言处理模型的设计，为后续的预训练语言模型奠定了基础。2018年：谷歌发布了BERT（Bidirectional Encoder Representations from Transformers），这是NLP领域的一个重要突破，为后续的语言模型发展奠定了基础。

2019年：OpenAI发布了GPT-2，展示了大规模预训练模型在文本生成上的强大能力。

2020年：OpenAI发布了GPT-3，拥有1750亿参数，进一步提升了语言生成和理解的能力。

2022年：OpenAI基于GPT-3.5架构，训练了对话模型ChatGPT，能够进行连贯的对话和回答问题，在全球范围内引起广泛关注。

2023年：OpenAI发布了GPT-4，具备多模态处理能力和更强的理解与生成性能，进一步推进了通用人工智能的发展。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-18

火山引擎OS Agent解决方案、豆包1.5·UI-TARS模型发布

2025-04-18

前沿导读 | 基于大模型智能体的出行行为模拟

2025-04-18

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

AI 重要概念科普与热门技术解析

2025-04-18

我对于AI领域商业模式的思考

2025-04-18

大模型落地的六大核心模式总览

2025-04-17

Agent 要被吃进大模型了

2025-04-17

OpenAI：发布 Codex 与收购 Windsurf

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

谁是MCP 的 AI 好搭档？

2025-04-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部