我要投稿

突发！OpenAI重磅上线GPT-4o mini，即日起免费，速度更快、性价比更高、支持50种语言｜钛媒体AGI

发布日期：2024-07-19 02:47:40 浏览次数： 4138

就在刚刚，OpenAI ChatGPT再度上新。

钛媒体AGI 7月18日消息，据CNBC和彭博报道，OpenAI周四推出一种新的 AI 模型“GPT-4o mini”——功能最强大的 AI 模型GPT-4o的更小参数量简化版本。

OpenAI表示，GPT-4o mini是“目前功能最强大、性价比最高的小参数模型，支持50种语言，替代GPT-3.5版本的ChatGPT，但该公司没有透露其参数和token规模信息。

简单来说，GPT-4o mini主打性价比，性能预计和Claude 3 Haiku版本接近。

据悉，GPT-4o mini即日起向ChatGPT免费用户以及 ChatGPT Plus和Team付费订阅用户开放，并将于下周向ChatGPT Enterprise企业版客户开放。

不过，截止发稿前，OpenAI暂未官宣此消息，并且，ChatGPT依然回应称目前ChatGPT免费版采用的是GPT-4架构。

实际上，早在今年5月14日，OpenAI推出可免费使用的全新旗舰AI模型GPT-4o。

OpenAI首席技术官米拉·穆拉蒂 (Mira Murati)表示，GPT-4o里的“o”是Omni（全能模型）的缩写，可实时进行音频、视觉和文本推理，它可以在短至232毫秒、平均320毫秒的时间内响应音频输入，与人类在对话中的反应速度一致。

米拉·穆拉蒂指出，在API使用方面，相比去年11月发布的GPT-4-turbo，GPT-4o价格降低一半（50%），速度提升两倍（200%）。

OpenAI CEO奥尔特曼（Sam Altman）当时称，新的GPT-4o是OpenAI有史以来最好的模型，它很智能，速度很快，是原生多模态，并且GPT-4o语音助手可供包括Plus、免费版本在内的所有ChatGPT用户使用。

然而，继收紧区域限制、停止不支持国家API后，GPT-4o语音助手也意外地迎来推迟。

今年6月22日，OpenAI宣布，原计划在6月下旬向一小群 ChatGPT Plus用户推出的GPT-4o语音功能，将推迟到7月，还需要一个月时间才能达到发布标准。至于原因，OpenAI称是因为需要更多时间进行安全测试。

“我们正在提高模型检测和拒绝某些内容的能力，同时努力改善用户体验，并准备我们的基础设施扩展到数百万，同时保持实时响应。”OpenAI表示。

如今，OpenAI似乎又重新调整，推出了小参数模型GPT-4o mini。而一般来说，这类小参数模型规模大约不到7B（70亿），可用于笔记本电脑、手机等端侧设备。

彭博表示，GPT-4o mini 提供了与GPT-4o一些相同的功能，OpenAI 计划随着时间的推移添加更多功能。

OpenAI API 产品负责人 Olivier Godement 表示：“我们的使命是推动前沿技术的发展，打造最强大、最实用的应用程序，我们当然希望继续开发前沿模型，不断突破极限。但我们也希望拥有最好的小型模型。”

Godement 表示，过去一周，一些开发人员一直在试用该模型。一家美国电邮初创公司Superhuman使用它来制作消息的自动回复，金融服务初创公司Ramp依靠它从收据中提取信息。

不过，目前的GPT-4o mini版本只能够接收和生成文本、图像两种，似乎不支持语音。OpenAI 表示，最终它将能够处理其他类型的内容。

另外，OpenAI 还表示，GPT-4o mini 是该公司首个使用其开发的新安全策略（称为“指令层次结构”）的 AI 模型。这种方法的目的是让 AI 系统优先执行某些指令（例如来自公司的指令），从而使人们更难让该工具做不该做的事情。

实际上，当前，在与GPT-4o mini同性能下的小端侧模型领域，估值800亿美金的OpenAI面临着诸多竞争对手。

包括 Anthropic 和 Alphabet 旗下的谷歌在内的 AI 公司，经常发布其最先进模型的更灵活、功能更少、成本更低的版本，比如Gemma-7B，以便为开发人员提供更多选择。而较小的模型可能在算力成本低的情况下实现最适合的基本任务，而较大的模型可能可以处理更复杂的任务。

值得一提的是，就在今年7月，仅有8人的法国AI实验室kyutai发布首个实时原生多模态Moshi，仅用了半年的时间从头训练，效果演示堪比5月发布的GPT-4o，被誉为“开源版”GPT-4o。

在国内，商汤早前发布国内首个所见即所得、实时流式多模态交互模型“日日新5o”，交互体验对标GPT-4o；而科大讯飞董事长刘庆峰直言，讯飞星火大模型的语音效果也堪比GPT-4o。另外，在7月16日左右，阿里云Qwen也公布了类似于GPT-4o的语音助手技术。

因此，接下来，GPT-4o mini将面临市场诸多竞争对手的局面。

但唯一可以确定的是，随着苹果、微软、Arm、英特尔、高通等诸多终端产业链龙头的加入，这类小端侧模型或将成为2024年最热门的大模型赛道之一。

爱芯元智创始人、董事长仇肖莘对钛媒体App表示，端侧AI大模型应用是一个巨大的机遇机会。大模型在端侧落地的场景首先可能是车，随后是手机、AI PC等。目前，大模型的落地现在还处于非常原始的阶段——broke force（乱局）。

“应用场景非常多样。一个3.2T的小芯片，如果集成到手机芯片里，手机就可以在本地完成很多应用的运行，而无需上云。”仇肖莘表示，生成式 AI 的底座大模型一定是在云端，但大模型是不是能够通过微调，或者某些优化等方式，形成行业大模型，落到边缘侧，而非这种几万亿的参数量，还是有可能的。

CNBC评价称，GPT-4o mini是OpenAI 努力走在“多模态”前沿技术的一部分，即在一个工具 ChatGPT 中提供多种媒介类型（如文本、图像、音频和视频）下的生成式 AI 技术能力。

清华大学计算机系长聘副教授，面壁智能联合创始人、首席科学家刘知远则强调，未来的大模型将是端云协同的模式。出于隐私保护、算力等考虑，把模型放在离用户更近的地方，具有重要的价值和意义。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-19

DeepSeek+Dify 构建本地知识库，真香！

2025-04-19

微软开源实时交互模型：提升Agent动态复杂处理能力

2025-04-19

微软最新 Playwright MCP 服务器强势来袭？

2025-04-18

OpenManus：开源版 Manus，无需邀请码，5 分钟极速体验！

2025-04-18

OpenAI开源34页Agents最佳实践白皮书~

2025-04-18

OpenAI推出终端编码智能体Codex CLI了

2025-04-18

“开源版coze”爆火，融资超 4.6 亿！如今 Docker 拉取量超 1 亿，斩获 77.5k star

2025-04-18

【开源看AI】GitDiagram：AI帮你理解任意代码库的架构

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

为什么大模型本地部署后“没了下文”？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB