突发!OpenAI重磅上线GPT-4o mini,即日起免费,速度更快、性价比更高、支持50种语言|钛媒体AGI
钛媒体AGI 7月18日消息,据CNBC和彭博报道,OpenAI周四推出一种新的 AI 模型“GPT-4o mini”——功能最强大的 AI 模型GPT-4o的更小参数量简化版本。OpenAI表示,GPT-4o mini是“目前功能最强大、性价比最高的小参数模型,支持50种语言,替代GPT-3.5版本的ChatGPT,但该公司没有透露其参数和token规模信息。简单来说,GPT-4o mini主打性价比,性能预计和Claude 3 Haiku版本接近。据悉,GPT-4o mini即日起向ChatGPT免费用户以及 ChatGPT Plus和Team付费订阅用户开放,并将于下周向ChatGPT Enterprise企业版客户开放。不过,截止发稿前,OpenAI暂未官宣此消息,并且,ChatGPT依然回应称目前ChatGPT免费版采用的是GPT-4架构。实际上,早在今年5月14日,OpenAI推出可免费使用的全新旗舰AI模型GPT-4o。OpenAI首席技术官米拉·穆拉蒂 (Mira Murati)表示,GPT-4o里的“o”是Omni(全能模型)的缩写,可实时进行音频、视觉和文本推理,它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。米拉·穆拉蒂指出,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。OpenAI CEO奥尔特曼(Sam Altman)当时称,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且GPT-4o语音助手可供包括Plus、免费版本在内的所有ChatGPT用户使用。然而,继收紧区域限制、停止不支持国家API后,GPT-4o语音助手也意外地迎来推迟。今年6月22日,OpenAI宣布,原计划在6月下旬向一小群 ChatGPT Plus用户推出的GPT-4o语音功能,将推迟到7月,还需要一个月时间才能达到发布标准。至于原因,OpenAI称是因为需要更多时间进行安全测试。“我们正在提高模型检测和拒绝某些内容的能力,同时努力改善用户体验,并准备我们的基础设施扩展到数百万,同时保持实时响应。”OpenAI表示。如今,OpenAI似乎又重新调整,推出了小参数模型GPT-4o mini。而一般来说,这类小参数模型规模大约不到7B(70亿),可用于笔记本电脑、手机等端侧设备。彭博表示,GPT-4o mini 提供了与GPT-4o一些相同的功能,OpenAI 计划随着时间的推移添加更多功能。
OpenAI API 产品负责人 Olivier Godement 表示:“我们的使命是推动前沿技术的发展,打造最强大、最实用的应用程序,我们当然希望继续开发前沿模型,不断突破极限。但我们也希望拥有最好的小型模型。”Godement 表示,过去一周,一些开发人员一直在试用该模型。一家美国电邮初创公司Superhuman使用它来制作消息的自动回复,金融服务初创公司Ramp依靠它从收据中提取信息。不过,目前的GPT-4o mini版本只能够接收和生成文本、图像两种,似乎不支持语音。OpenAI 表示,最终它将能够处理其他类型的内容。另外,OpenAI 还表示,GPT-4o mini 是该公司首个使用其开发的新安全策略(称为“指令层次结构”)的 AI 模型。这种方法的目的是让 AI 系统优先执行某些指令(例如来自公司的指令),从而使人们更难让该工具做不该做的事情。实际上,当前,在与GPT-4o mini同性能下的小端侧模型领域,估值800亿美金的OpenAI面临着诸多竞争对手。
包括 Anthropic 和 Alphabet 旗下的谷歌在内的 AI 公司,经常发布其最先进模型的更灵活、功能更少、成本更低的版本,比如Gemma-7B,以便为开发人员提供更多选择。而较小的模型可能在算力成本低的情况下实现最适合的基本任务,而较大的模型可能可以处理更复杂的任务。值得一提的是,就在今年7月,仅有8人的法国AI实验室kyutai发布首个实时原生多模态Moshi,仅用了半年的时间从头训练,效果演示堪比5月发布的GPT-4o,被誉为“开源版”GPT-4o。在国内,商汤早前发布国内首个所见即所得、实时流式多模态交互模型“日日新5o”,交互体验对标GPT-4o;而科大讯飞董事长刘庆峰直言,讯飞星火大模型的语音效果也堪比GPT-4o。另外,在7月16日左右,阿里云Qwen也公布了类似于GPT-4o的语音助手技术。因此,接下来,GPT-4o mini将面临市场诸多竞争对手的局面。
但唯一可以确定的是,随着苹果、微软、Arm、英特尔、高通等诸多终端产业链龙头的加入,这类小端侧模型或将成为2024年最热门的大模型赛道之一。爱芯元智创始人、董事长仇肖莘对钛媒体App表示,端侧AI大模型应用是一个巨大的机遇机会。大模型在端侧落地的场景首先可能是车,随后是手机、AI PC等。目前,大模型的落地现在还处于非常原始的阶段——broke force(乱局)。“应用场景非常多样。一个3.2T的小芯片,如果集成到手机芯片里,手机就可以在本地完成很多应用的运行,而无需上云。”仇肖莘表示,生成式 AI 的底座大模型一定是在云端,但大模型是不是能够通过微调,或者某些优化等方式,形成行业大模型,落到边缘侧,而非这种几万亿的参数量,还是有可能的。CNBC评价称,GPT-4o mini是OpenAI 努力走在“多模态”前沿技术的一部分,即在一个工具 ChatGPT 中提供多种媒介类型(如文本、图像、音频和视频)下的生成式 AI 技术能力。
清华大学计算机系长聘副教授,面壁智能联合创始人、首席科学家刘知远则强调,未来的大模型将是端云协同的模式。出于隐私保护、算力等考虑,把模型放在离用户更近的地方,具有重要的价值和意义。