微信扫码
与创始人交个朋友
我要投稿
北美时间2024年10月1日,2024年度的OpenAI开发者大会(OpenAI DevDay 2024)如期而至。
在OpenAI DevDay 2024的最新更新中,OpenAI宣布从本周开始,实时语音功能(Advanced Voice Mode)将面向全球所有ChatGPT Enterprise、Edu和Team用户推出。此外,免费用户也将能够抢先体验到这一功能。
虽然OpenAI如是说,但不出意外,ChatGPT免费用户应该是只能够短暂体验实时语音功能(Advanced Voice Mode)这一新功能。毕竟对于ChatGPT Plus用户,实时语音功能也是有着聊天时长限制的,超过规定的聊天时长后,语音模式将会自动切换为标准语音模式(标准语音模式)。
目前OpenAI并没有给出明确的聊天时长限制,只是表示聊天时长的限制可能会随着计算资源而动态调整。聊天时长达到上限前15分钟,ChatGPT会发出通知提醒。
对于开发者,OpenAI推出了Realtime API
,允许开发者在其应用中构建快速的语音聊天体验,类似于上面提到的ChatGPT实时语音模式(Advanced Voice Mode),但适用于开发者自己的应用。此API以低延迟提供自然的语音对话,现已面向付费开发者以公测形式推出。除了Realtime API
,OpenAI还在其Chat Completions API
中增加了音频输入和输出功能,开发者无需再将多个模型组合使用,单次API调用即可实现自然的语音对话体验。
Realtime API
实现快速的语音到语音转换,并支持在对话中插入功能调用,使语音助手可以执行操作或拉取上下文。Realtime API
支持文本和音频输入输出,按token分别计费,价格为每百万个输入音频tokens 100美元,每百万个输出音频tokens 200美元。Realtime API
具备多层安全防护,防止滥用,并对用户输入输出进行监控。在OpenAI DevDay的更新中,OpenAI在Playground推出了自动生成Prompt提示词的功能。此功能可以帮助开发者更快地将想法转化为原型。开发者只需简单描述其使用模型的目的,Playground就会自动生成提示、有效的函数架构和结构化输出格式,让开发者更轻松地进行原型设计。
用过Claude控制台的小伙伴应该可以联想到,OpenAI新推出的这个功能对标的就是Claude几个月前在控制台添加的自动生成提示词的功能。详情可以看我这篇文章:《Claude更新王炸功能:一键生成、评估、优化提示词!》。
此外,OpenAI推出了Prompt Caching(提示缓存)功能,让开发者能够降低使用成本并加快提示词处理速度。此功能可自动对模型最近处理过的输入令牌进行缓存,开发者可以以50%的折扣价格重复使用这些令牌,并且不会影响延迟。
GPT-4o
模型的未缓存输入令牌费用为每百万tokens 2.50美元,而缓存令牌的费用为1.25美元。GPT-4o
、GPT-4o mini
、o1-preview
和o1-mini
模型,以及它们的微调版本。提示内容超过1024个令牌时,API会自动缓存,开发者无需修改API集成。最后提一句,OpenAI这次推出的Prompt Caching(提示缓存)功能对标的也是Claude在今年8月推出的同名称的功能。
OpenAI在本次更新中推出了Model Distillation(模型蒸馏)功能,这是一个用于微调较小、成本效益更高模型的工作流程,利用大型模型(如GPT-4o
或o1-preview
)的输出来提升性能。
Model Distillation(模型蒸馏)功能现已向所有开发者开放,支持所有OpenAI模型。开发者每天可以获得2百万个免费训练令牌用于GPT-4o mini
,直到10月31日。此外,存储完成是免费的,而Evals在2024年底之前,每周最多可运行7次免费的评估,条件是开发者选择将其评估共享给OpenAI以改进未来的模型。
OpenAI宣布在其微调API中添加了对视觉微调的支持,开发者现在可以使用图像和文本微调GPT-4o
。这一功能为图像理解任务提供了更强大的定制能力,适用于增强视觉搜索、改进自动驾驶的物体检测、或更精确的医学图像分析等应用。
视觉微调现已向所有付费开发者开放,并支持最新的GPT-4o
模型(gpt-4o-2024-08-06)。OpenAI提供了免费的视觉微调训练令牌,2024年10月31日前每天最多100万免费令牌。之后,微调训练将按每百万tokens 25美元收费,推理过程则按每百万输入tokens 3.75美元、输出tokens 15美元计费。
OpenAI宣布扩大o1模型API的使用权限,允许账号使用级别第3层(usage tier 3)的开发者访问,并提升了调用速率限制,使其与GPT-4o
的速率限制相同,以满足生产级别的应用开发。
o1-preview
每分钟10,000个请求,o1-mini
每分钟30,000个请求。o1-preview
和o1-mini
均为每分钟10,000个请求。o1-preview
和o1-mini
均为每分钟5,000个请求。53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-04-11
2024-07-09
2024-08-13
2024-07-18
2024-10-25
2024-07-01
2024-06-17