AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远
发布日期:2024-09-17 20:04:22 浏览次数: 1728 来源:AI范儿



OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我纠错能力,比之前的模型更接近人类思维。尽管在自然语言处理任务中旧版 GPT-4o 仍占优势,o1 代表了向通用人工智能(AGI)迈进的重要一步。


人工智能与人类智慧的边界再次变得模糊。

OpenAI 周四发布了全新的 o1 系列模型,这标志着 AI 技术又向前迈进了一步。公司在声明中提到,这些模型的设计初衷是“在回答问题之前,花更多时间进行思考”。这不仅是技术上的进化,也是对更接近人类思维方式的探索。

相比之前的模型,o1 在处理复杂任务时表现更加出色,尤其是在科学、编程和数学等领域。它不仅仅是在执行指令,更是在面对挑战时展现出更具深度的思考模式,逐渐缩小了与人类思维的差距。简单来说,它们的思维方式比现有的 AI 聊天机器人更接近人类。

虽然 OpenAI 早期的模型已经在诸如 SAT 考试和律师资格考试等标准化测试中表现不俗,但 o1 在此基础上更进一步。在物理、化学和生物学等高难度学科任务中,它的表现已经达到了接近博士生的水平

一个显著的例子是国际数学奥林匹克竞赛的资格考试中,o1 相比五月发布的 GPT-4o 有了显著进步:GPT-4o 只答对了 13% 的题目,而 o1 则拿下了 83% 的分数。这种提升并不仅仅是技术参数的改进,它背后是 o1 更强的推理能力和解决问题的策略。

这部分得益于一种叫“思维链”的提示技术。o1 能够识别和纠正自己的错误,将复杂问题分解成更为简单的步骤,当现有方法行不通时,它还会尝试不同的解决方案。这种改进让它在面对棘手的挑战时表现得更加灵活。

然而,o1 并非没有局限性。在数据分析、编程和数学等推理密集型任务中,测试者更偏好 o1 的回答;但在涉及自然语言处理、个人写作等任务时,GPT-4o 仍然具有优势。这意味着,在 AI 技术的不断进步中,我们依然需要保持清醒的认识,继续优化和完善不同场景下的能力。

OpenAI 的长远目标是实现通用人工智能(AGI),也就是能够在各类任务中模拟甚至超越人类能力的 AI 系统。为了衡量这个进展,OpenAI 引入了一个五级分类系统,从能够与人类对话的基础 AI(第一级),到可以承担整个组织职责的高级 AI(第五级),每一阶段都是向 AGI 更近的一步。

OpenAI设定的人工智能发展的五个阶段

第 1 级:聊天机器人,能与人类进行对话的 AI
第 2 级:推理者,具有类似人类的解决问题能力【目前在这里】
第 3 级:代理者,能够为用户执行任务的系统
第 4 级:创新者,能够帮助进行发明创造的 AI
第 5 级:组织,能够承担整个组织工作职责的 AI

目前,o1 已经迈入了第二级——推理者阶段。它不仅仅是一个工具,更具备了解决复杂问题的能力,能够在没有外部工具帮助下,完成类似于博士生所能解决的任务。

未来的目标是打造出第三级的“代理者”AI,它能够连续数天为用户执行任务,而更高级的“创新者”和“组织者”AI 则会为未来的发明创造和组织管理提供强大的智能支持。

多年来,OpenAI 一直声称致力于开发所谓的通用人工智能(AGI),即能在大多数任务中胜过人类的计算机系统。目前,这类系统尚未出现。OpenAI 的首席执行官 Sam Altman 此前表示,他预计 AGI 在本十年内可能会实现。

尽管通用人工智能的实现仍然充满挑战,但 OpenAI 正一步步向这个目标迈进。AGI 可能不会在短期内实现,但每一次的进步都让我们离它更近了一步。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询