我要投稿

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

发布日期：2024-07-20 07:59:59 浏览次数： 14618

你的ChatGPT升级了吗？

从昨天开始，不论是付费用户还是免费用户，不论是网页端还是app端，ChatGPT进行了一项重大更新：GPT-3.5模型彻底退出历史舞台，取而代之的是一个名为GPT-4o mini的新模型！

免费用户可使用GPT-4o（有着约10条/3小时的使用次数限制）和GPT-4o mini（免费使用）两个模型。

ChatGPT Plus用户可使用GPT-4o（80条/3小时）、GPT-4 Turbo（40条/3小时）和GPT-4o mini（免费使用）三个模型。

来自OpenAI的反击

这次GPT-4o mini新模型的推出无疑是OpenAI针对竞争对手们展开的一次反击。不论是Anthropic还是谷歌，最近都有着亮眼的成绩，尤其是Anthropic，先是推出了Claude 3.5 Sonnet这个Claude 3的升级模型，“智商”更高且成本更低，同时更新动作不断，发布了Artifacts这个使用体验极好的生成内容展示窗口，推出了Claude提示词库，以及在Anthropic控制台新增了提示词一键生成和评估优化功能，并且推出了Claude安卓app！而作为老大哥的OpenAI，自从今年5月13日发布GPT-4o后就几乎“销声匿迹”，没有什么实质性的更新。无数人期待的GPT-4o实时语音功能也是一鸽再鸽，遥遥无期。

北美时间7月18日，先是OpenAI开发者官方账号官宣了GPT-4o mini模型的发布，表示该模型相比GPT-3.5 Turbo更智能，成本更低。

随后OpenAI官方账号转发了这一帖子并表示GPT-4o mini模型已经可以在API以及ChatGPT中使用。

关于`GPT-4o mini`模型

“Most cost-efficient small model-最具性价比的小型模型”，这是OpenAI官方给这个最新的GPT-4o mini模型定下的宣传语。

作为最具性价比的模型，GPT-4o mini的推出旨在让AI技术更广泛地可及。GPT-4o mini在MMLU测试中得分82%，这一分数已经超过了GPT-4 Turbo 01-25模型。价格方面，GPT-4o mini比GPT-3.5 Turbo便宜60%以上，其定价为每百万输入tokens 0.15美元和每百万输出tokens 0.6美元。该模型支持广泛的任务，具有低成本和低延迟优势，适用于调用多个API、传递大量上下文和快速响应客户互动等场景。GPT-4o miniAPI目前支持文本和图片输入功能（多模态，这是GPT-3.5所不具备的功能），未来将扩展到视频和音频的输入输出。同时，GPT-4o mini拥有128K tokens的上下文窗口，支持每次请求最多16K输出标记，并具备截至2023年10月的知识。

更高的“智商”

更高的“智商”意味着更高的文本智能以及更强的推理能力。GPT-4o mini模型在学术基准测试中表现出色，超越了GPT-3.5 Turbo和其他小型模型，并支持与GPT-4o相同的语言范围。该模型在函数调用方面表现优异，使开发人员能够构建与外部系统交互的应用程序，并且相比GPT-3.5 Turbo改进了长上下文处理能力。

推理任务：在涉及文本和视觉的推理任务中，GPT-4o mini以82.0%的MMLU测试得分优于其他小模型，相比之下，Gemini Flash得分 77.9%，Claude Haiku得分73.8%。
数学和编码能力：GPT-4o mini在数学推理和编码任务中同样表现出色。在MGSM测试中，GPT-4o mini取得了87.0%的高分，而Gemini Flash和Claude Haiku分别为75.5%和71.7%。在人类评估（HumanEval）测试中，GPT-4o mini的得分为87.2%，显著高于Gemini Flash的71.5%和Claude Haiku的75.9%。
多模态推理：在MMMU测试中，GPT-4o mini也表现出色，得分59.4%，而Gemini Flash和Claude Haiku分别为56.1%和50.2%。