微信扫码
与创始人交个朋友
我要投稿
OpenAI 终于推出Prompt Caching 给开发者省钱了。
OpenAI最新推出的Prompt Caching功能,一下子就让API调用成本腰斩,速度翻倍。这下,AI应用开发者们该笑醒了。
让我们来看看这个新功能:
成本砍半,速度飙升
这意味着什么?
简单来说,开发者可以用更少的钱,做更多的事。
适用范围广,自动生效
这可不是什么小打小闹的实验性功能。OpenAI直接把它应用到了主力模型上:
最爽的是,这个功能是自动应用的。开发者们不需要修改一行代码,就能享受到这个福利。
缓存机制详解
开发者优化建议
@bidhanxyz( @bagel_network 的创始人)甚至预测:
有人会在API上实现模糊缓存,将成本再降低50%。
这话说的,OpenAI的工程师们怕是要加班了。
@ShenHuang_(Google Travel Ads的技术主管)也表示:
这可以节省我大量的API调用成本?
看来,不只是小开发者,连大公司都对这个功能垂涎三尺啊。
AI开发的春天来了?
这个功能早有呼声,@AI_GPT42说到:
我一直在等这个功能?
OpenAI这一次,终于回应了开发者的需求。可以说是跟上了其他厂商(如deepseed, claude等),为AI应用开发铺平了道路。
成本降低,速度提升,用同样的钱能干更多的事,这也意味着更多的创新可能性。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-26
新型LLM优化技术削减内存成本高达75%
2024-12-26
AI模型训练到底在训练什么?
2024-12-25
Cursor小白必看:听说你还在安装配置环境?学会这个让你告别环境烦恼!
2024-12-25
微软变脸OpenAI,模型价值之争压不住了?
2024-12-25
GPT-5 研发一年半进度堪忧!每轮 5 亿美金训练成本打水漂,还得雇人从头“造数据”
2024-12-25
基于昇腾910B,使用XTuner微调一个InternLM个人小助手丨玩转书生大模型
2024-12-25
BERT新版本:ModernBERT -- Smarter, Better, Faster, Longer
2024-12-25
Cursor 0.44 重磅更新:全面提升 Agent 能力
2024-09-18
2024-07-11
2024-07-11
2024-07-09
2024-06-11
2024-10-20
2024-07-26
2024-07-23
2024-07-20
2024-07-12