AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI发布高级语音模式(AVM):ChatGPT更自然的对话体验
发布日期:2024-09-29 07:21:59 浏览次数: 1651 来源:Halo咯咯


01

概述 

OpenAI于周二宣布,将向ChatGPT Plus和团队级别的付费用户推出高级语音模式(AVM)。这项音频功能将使用户与ChatGPT的对话更加自然。AVM的初期推出将面向ChatGPT Plus和Teams用户,企业与教育用户则将从下周开始获得使用权限。
作为此次更新的一部分,AVM的界面也经过了重新设计,现在以一个蓝色的动态球体来代表这项功能,取代了5月份展示该技术时所用的动态黑点。用户将在ChatGPT应用中的语音图标旁收到一个弹出窗口,以提示AVM功能的可用性。

02

功能新增与调整

此外,ChatGPT新增了五种新的声音,分别是Arbor、Maple、Sol、Spruce和Vale,使得ChatGPT的总声音种类达到九种,几乎与谷歌的Gemini Live相当。这些名称均受到大自然的启发,可能是因为AVM旨在使ChatGPT的使用体验更加自然。
值得注意的是,OpenAI在此次更新中没有包括之前春季更新中展示的Sky声音。这是因为演员斯嘉丽·约翰逊对该声音提出异议,认为其与她在电影《她》中扮演的AI系统的声音过于相似。OpenAI迅速响应,撤下Sky声音,并声明从未有意模仿约翰逊的声音。这一决定显示了OpenAI对用户反馈的重视。

03

性能改进与个性化功能

OpenAI还表示,自AVM的alpha测试发布以来,已经进行了一些改进。ChatGPT的语音功能现在对各种口音的理解更为精准,对话也变得更加流畅和快速。此外,OpenAI将ChatGPT的一些定制功能扩展到了AVM,包括允许用户个性化ChatGPT的响应方式以及增强记忆功能,以便ChatGPT能够在后续对话中引用之前的内容。
然而,此次推广中并未包括ChatGPT的视频和屏幕共享功能。该功能原本应该允许GPT-4同时处理视觉和听觉信息。目前,OpenAI尚未提供这些多模态功能推出的时间表。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询