微信扫码
与创始人交个朋友
我要投稿
你的ChatGPT升级了吗?
从昨天开始,不论是付费用户还是免费用户,不论是网页端还是app端,ChatGPT进行了一项重大更新:GPT-3.5
模型彻底退出历史舞台,取而代之的是一个名为GPT-4o mini
的新模型!
免费用户可使用GPT-4o
(有着约10条/3小时的使用次数限制)和GPT-4o mini
(免费使用)两个模型。
ChatGPT Plus用户可使用GPT-4o
(80条/3小时)、GPT-4 Turbo
(40条/3小时)和GPT-4o mini
(免费使用)三个模型。
这次GPT-4o mini
新模型的推出无疑是OpenAI针对竞争对手们展开的一次反击。不论是Anthropic还是谷歌,最近都有着亮眼的成绩,尤其是Anthropic,先是推出了Claude 3.5 Sonnet
这个Claude 3的升级模型,“智商”更高且成本更低,同时更新动作不断,发布了Artifacts这个使用体验极好的生成内容展示窗口,推出了Claude提示词库,以及在Anthropic控制台新增了提示词一键生成和评估优化功能,并且推出了Claude安卓app!而作为老大哥的OpenAI,自从今年5月13日发布GPT-4o
后就几乎“销声匿迹”,没有什么实质性的更新。无数人期待的GPT-4o
实时语音功能也是一鸽再鸽,遥遥无期。
北美时间7月18日,先是OpenAI开发者官方账号官宣了GPT-4o mini
模型的发布,表示该模型相比GPT-3.5 Turbo
更智能,成本更低。
随后OpenAI官方账号转发了这一帖子并表示GPT-4o mini
模型已经可以在API以及ChatGPT中使用。
GPT-4o mini
模型“Most cost-efficient small model-最具性价比的小型模型”,这是OpenAI官方给这个最新的GPT-4o mini
模型定下的宣传语。
作为最具性价比的模型,GPT-4o mini
的推出旨在让AI技术更广泛地可及。GPT-4o mini
在MMLU测试中得分82%,这一分数已经超过了GPT-4 Turbo 01-25
模型。价格方面,GPT-4o mini
比GPT-3.5 Turbo
便宜60%以上,其定价为每百万输入tokens 0.15美元和每百万输出tokens 0.6美元。该模型支持广泛的任务,具有低成本和低延迟优势,适用于调用多个API、传递大量上下文和快速响应客户互动等场景。GPT-4o mini
API目前支持文本和图片输入功能(多模态,这是GPT-3.5所不具备的功能),未来将扩展到视频和音频的输入输出。同时,GPT-4o mini
拥有128K tokens的上下文窗口,支持每次请求最多16K输出标记,并具备截至2023年10月的知识。
更高的“智商”意味着更高的文本智能以及更强的推理能力。GPT-4o mini
模型在学术基准测试中表现出色,超越了GPT-3.5 Turbo
和其他小型模型,并支持与GPT-4o
相同的语言范围。该模型在函数调用方面表现优异,使开发人员能够构建与外部系统交互的应用程序,并且相比GPT-3.5 Turbo
改进了长上下文处理能力。
推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini
以82.0%的MMLU测试得分优于其他小模型,相比之下,Gemini Flash
得分 77.9%,Claude Haiku
得分73.8%。
数学和编码能力:GPT-4o mini
在数学推理和编码任务中同样表现出色。在MGSM测试中,GPT-4o mini
取得了87.0%的高分,而Gemini Flash
和Claude Haiku
分别为75.5%和71.7%。在人类评估(HumanEval)测试中,GPT-4o mini
的得分为87.2%,显著高于Gemini Flash
的71.5%和Claude Haiku
的75.9%。
多模态推理:在MMMU测试中,GPT-4o mini
也表现出色,得分59.4%,而Gemini Flash
和Claude Haiku
分别为56.1%和50.2%。
GPT-4o mini
API有多便宜?目前GPT-4o mini
模型的定价为每百万输入tokens 0.15美元和每百万输出tokens 0.6美元,这是一个什么概念,大约相当于标准书籍的2500页。同时OpenAI表示计划在未来几天推出GPT-4o mini
的微调功能。
当然,在ChatGPT中,免费、Plus和Team用户将从即日起可以免费使用GPT-4o mini
,以代替GPT-3.5
。企业用户将在下周开始开放访问权限。
GPT-4o mini
模型的推出,标志着GPT-3.5
时代的终结,全民进入GPT-4
时代。从AI技术的普惠性来看,这是一个必然,或早或晚而已。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-07
Ollama 0.4 版本发布,支持 Llama 3.2 Vision 视觉模型,实测满足个人使用
2024-11-07
Chat2DB:智能数据库查询工具,一款强大的数据库聊天机器人工具
2024-11-06
分步拆解,使用Qwen大模型创建多语言聊天和翻译应用
2024-11-06
Neolink.AI 集成 Ollama ,简化本地AI模型部署
2024-11-06
一个很酷的想法,基于llm的浏览器自动化,这个开源项目有前途
2024-11-06
刚刚,腾讯混元开源两大核心模型!
2024-11-06
Standard Intelligence Lab 推出 Hertz-Dev 实现AI实时对话了
2024-11-06
PymuPDF4llm:PDF 提取的革命
2024-05-06
2024-08-13
2024-07-25
2024-06-12
2024-06-16
2024-07-11
2024-06-15
2024-07-20
2024-07-25
2024-07-25