我要投稿

OpenAI推迟GPT-4o语音模式，还需要一个月时间

发布日期：2024-06-26 09:11:37 浏览次数： 2497 作者：AIGC开放社区

6月26日凌晨，OpenAI在社交平台宣布，推迟GPT-4o语音模式，还需要一个月的时间来完善产品。预计今年秋天，所有ChatGPT Plus用户都可以使用该功能。

OpenAI原本的计划是在6月底开始向一小部分ChatGPT Plus用户提供测试版本，但因为产品还有安全、性能、算力等方面的问题需要调整，所以推迟了发布时间。

OpenAI还在今天发布了面向macOS系统的桌面版ChatGPT，支持上传文件、搜索对话、图像解读等多种功能。

GPT-4o是OpenAI在今年5月14日发布的最新模型，具备跨文本、语音、视频的推理能力同时可以生成图片，整体性能相当全面。

其语音模式是一大亮点，能够进行自然、流畅的拟人对话，拥有极高的语音识别、理解和生成能力。例如，在医疗领域，GPT-4o语音模式能够帮助医生收集患者病史，提供初步诊断建议，并为患者解答常见的健康问题；

在教育领域，该语音模式能根据学生提供的图片，详细讲解每一步的解答原理以及过程，其能力可以媲美家教老师。

GPT-4o多模态功能展示

所以，全球用户对GPT-4o的语音模式非常期待，渴望拿到属于自己的“贾维斯”。而苹果也已经与OpenAI达成技术合作，希望通过GPT-4o的多模态能力来增强Siri的理解和执行能力。

当时OpenAI在展示GPT-4o时，说的是未来几周内提供使用，所以，就有网友嘲讽道几周变4—6个月，典型的OpenAI套路。

值得一提的是，OpenAI在今年2月15日展示的文生视频模型Sora，至今已经四个多月了还处于邀请测试期，距离公测遥遥无期。

至今还有网友惦记着Sora呢~~

如果OpenAI根本没准备好全面公测，你大可不必那么早展示，纯纯吊人胃口啊。

一大堆新注册的ChatGPT Plus用户，不就是为了等GPT-4o语音模式吗，一个月20美元可是辛苦搬砖钱啊~

这不，就有用户直接取消了ChatGPT Plus订阅，啥时候上GPT-4o语音模式，再开通了。

OpenAI最近的饼是画的有点多了，全面实现公测的却不多。

OpenAI确实食言了，当时承诺的是会在短期内逐步向Plus用户开放，现在却又延期有点让人难以接受了。

有的网友还顺路表扬了一下Anthropic最近发布的Claude 3.5 Sonnet，所见即所得，发布就能用。

并且表示，可能Anthropic的多模态语音模型将比GPT-4o更早发布。

不过也有人指出，OpenAI之所以推迟发布，可能和中增根的加入有关，需要在各个方面都符合国家安全局的规定，很快会进入一个枷锁模式。

此外，OpenAI发布了面向macOS桌面版ChatGPT，可以进行文件解读、图片解读、搜索对话等多种功能。

例如，用户可以上传一份PDF文件，基于这些内容向ChatGPT进行提问。

也可以上传一份图片，让ChatGPT解读图像中的内容，或者基于该图片进行文本创作。

当你与ChatGPT聊了几千条内容时，可以通过“搜索对话”功能快速来查找自己想要的内容。

用户在macOS系统打开ChatGPT也很方便，只需要按下Option + Space快捷键即可。

本文素材来源OpenAI官网，如有侵权请联系删除

END

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

一文说清：什么是算法备案、大模型备案、大模型登记 2.0

2025-04-29

MCP：AI时代的“万能插座”，大厂竞逐的焦点

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

一站式AI应用开发平台 Firebase Studio

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

AI 落地难？MCP 或许就是那把「关键钥匙」！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

从MCP到超级Agent：这场AI生产力革命将淘汰谁？

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB