我要投稿

大模型智商已达120

发布日期：2024-10-17 06:49:07 浏览次数： 1873 作者：科亦有道

引言

人工智能专家John J. Hopfield和Geoffrey E. Hinton获得了2024年诺贝尔物理学奖，表彰他们通过人工神经网络实现机器学习的基础性发现和发明。这个事件引起了全世界的轰动，尤其是人工智能科技人员的轰动，说明了近几年大模型的快速发展正将改变各行各业，也预示着通用人工智能可能成为可能。

丹尼尔·卡尼曼的《思考，快与慢》中讲述了对大脑思考速度的看法，我们的大脑有快与慢两种作决定的方式。系统1（快思维）是快速、自动、频繁、情感驱动且几乎不需要消耗精力的思维方式。它基于直觉和经验，能够在瞬间作出反应。系统2（慢思维）是缓慢、有意识、逻辑性强且需要消耗大量精力的思维方式。它负责复杂的思考、决策和规划，能够进行深度分析和推理。

大模型的头部企业OpenAI于2024年9月发布了新的人工智能模型o1，从其名称就可以看出和之前的GPT4系列模型采用了不同的训练方法、训练数据以及不同的模型能力。大模型o1的诞生正将人工智能从快思维延伸到慢思维，以弥补GPT在一些方面的不足。当然，两者互为补充，正如人类同时需要快思维和慢思维。

通过慢思考，我们能够更加深入的分析和解决问题，尤其是复杂问题。X博主Maxim Lott用o1进行了挪威门萨智商测试，结果测得它的智商高达120，o1在35个智商问题中答对了25个，远远超过了其他所有的大模型，也远远高于大多数人类的表现。

一、o1大模型原理

o1大模型有着强大复杂推理能力，迅速在业界掀起了热潮，也正引领大模型技术朝着深水区前行。o1大模型通过长时间、多层次的推理，使得在解决数学、编码和科学等问题时表现出了卓越的性能。

o1大模型通过自我对弈强化学习、思维链机制、推理标记以及专门的训练数据集使得大模型在慢思考、深度思考方面有了长足进步。

1、自我对弈强化学习

o1大模型采用了大规模自我对弈强化学习（Self-Play RL）的训练方法。这种方法类似于人类通过不断尝试和纠错来掌握新技能。在训练过程中，模型会生成多个推理步骤或思考路径，并通过设置奖惩机制来评估这些路径的优劣。通过不断的迭代和优化，模型逐渐提高了自己的推理能力。

2、思维链

o1大模型通过内置的思维链（CoT）机制。o1大模型在回答之前会进行长时间、多层次的推理，这是其区别于传统语言模型的一次性生成答案的关键，通过在回答前进行详细的推导和验证，从而显著提高了答案的准确性和可靠性。

思维链是一个逐步推理的过程，模型会考虑问题的不同方面，并尝试将这些方面联系起来，以形成一个连贯的推理路径。过程中，模型会利用自身的知识储备和逻辑推理能力，对问题进行深入的分析和探讨。

3、推理标记

为了进一步提升模型的推理能力， o1大模型中引入了推理标记。这些标记用于辅助模型在对话环境中进行深层思考，帮助模型更好地理解和解决问题。

4、专门的训练数据集

o1大模型准备了专门的训练数据集，这些数据集包含了大量复杂问题和对应的解题步骤。通过在这些数据集上进行训练，模型逐渐掌握了处理复杂推理任务的能力。

二、o1和GPT4的关系

OpenAI将AGI（通用人工智能）定义为“在最具经济价值的任务中超越人类的高度自治系统”，并划分了五个发展阶段：

第一阶段：ChatBots聊天机器人，比如ChatGPT。

第二阶段：Reasoners推理者，解决博士水平基础问题的系统。

第三阶段：Agents智能体，代表用户采取行动的AI代理。

第四阶段：Innovators创新者，帮助发明的AI。

第五阶段：Organizations组织，AI可以执行整个人类组织的工作。

显然GPT4属于第一阶段，o1正步入第二阶段。

o1大模型在多项考试中拿下高分。它在 Codeforces 编程竞赛中超过了 89% 的参赛者，在美国数学奥林匹克竞赛的资格赛中得分达到83%，在物理、生物和化学问题的基准测试中超越了人类博士水平的准确率。

GPT4强大的文本处理能力，使得在文本协作、编辑等语言类任务方面有着一定的优势。o1的慢思考能力使得在数据处理、数学运算、代码编写等逻辑类任务方面胜出。

数学家陶哲轩也认为，o1大模型再加点助力，迭代一两次，就可以成为一个有能力的研究生。这也预示着学术界对o1大模型有了很大的肯定，相比GPT4来说，已经有了很大的不同。

三、o1带来的启示

GPT4大模型从大量语言类数据集中学会了根据当前输入，推测后续输出的能力。GPT4可以理解为具备了搜索能力，能够从大量语言知识中找到输出的答案。

o1大模型从大量推理类数据集中学会了分析思维，根据输入的问题，推理和分析执行步骤，每个步骤中再进行具体的回答。o1可以理解为具备了逻辑能力，先分析问题拆解问题，再进行检索和输出。

可见，大模型本质上都在模仿人类成长学习的过程，不同的数据集加上不同的大模型结构，使得大模型能够从中学习和记忆相关的能力。大模型通过模仿开始理解和进化，借鉴学习到的相似经验进行参考和执行，逐步找到答案。

人类成长的过程就是理解世界、寻找规律的过程。AI正在学习人类思维的运作方式，和人类思考的方式越来越接近。o1大模型的诞生使得AI也逐步具备了寻找复杂规律的能力，也预示着大模型未来能够在各种科学领域助力人类更好的理解和发现新规律。

试想一下，我们在工作中遇到难题，尤其是复杂的问题，大模型根据学习到的经验，已经可以给出我们专业的建议思路和步骤，指导工作的推进和技术的攻关。学生在学习中遇到困难的学习题，大模型可以快速给出解题思路，甚至可以给出多种的推导过程，锻炼学生的思维能力，等等还有许多典型的应用场景。

可以预见的是，o1大模型的诞生，将在很多行业带来大的创新和改变。希望国内的大模型专家和技术人员能够快速跟进，有所作为，有所突破。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

一文了解Text Embedding模型：从text2vec、openai-text embedding到m3e、bge（上）

2025-04-27

RollingAI创始人刘开出席2025年中国绿公司年会，解读AI商业化落地新思维

2025-04-27

一文讲透 MCP 与 Function calling，你想看的都在这里

2025-04-27

混合专家 (MoE) 架构：现代大模型的“秘密武器”

2025-04-27

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

大模型应用系列：两万字解读MCP

2025-04-27

一篇文章说清楚什么是生成式AI、决策式AI、判别式AI

2025-04-27

字节Trae 大更新，5分钟看懂AI生成的“神秘代码块”

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB