AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


盘点国内外大模型推理服务 API 价格
发布日期:2024-06-12 21:22:36 浏览次数: 4347 来源:慢慢学 AIGC



本文将为你盘点截至 2024.5.17 国内各个大模型推理服务的 API 价格以及支持的特性(上下文窗口长度、是否支持多模态输入等)。注意价格可能会随时由厂商调整,请以官方最新数字为准。汇总表格在文末。本文尚未收纳的条目会在后台进行更新,需要原始文档可以私信获取。

注意:为了方便横向对比,我们的价格都以百万(1M)tokens 费用为准,其中输入 tokens 和输出 tokens 比例均为 50%,国内外费用统一换算为人民币(CNY)。


OpenAI GPT


OpenAI 是目前行业的标杆,具有目前最强大的模型 GPT-4o 以及最广泛的用户,价格贵有贵的道理。有关 GPT-4o 详细信息可以查看《重磅:OpenAI 发布 GPT-4o,支持实时音视频交互》

信息来源:https://platform.openai.com/docs/models

价格表:

Anthropic Claude

Anthropic 与 OpenAI 的渊源颇深。由于在 OpenAI 在发展方向上产生分歧,担心微软对 OpenAI 的首次 10 亿美元的投资后,会使其走上更加商业化的道路,偏离初衷,彼时为 OpenAI 研发副总裁 Dario Amodei 领导的团队选择离开并在 2021 年成立了 Anthropic。2023 年 3 月份 Anthropic 发布了一款类似 ChatGPT 的AI聊天机器人产品 Claude。Claude 有 520 亿个参数,最初通过 Slack 集成在封闭测试版中提供。2023 年 7月,Anthropic 推出了新版人工智能聊天机器人:Claude 2,上下文扩展至 100K,直接与 GPT-4 竞争。2024 年 3 月推出 Claude 3,步步紧跟 OpenAI 。


信息来源:https://www.anthropic.com/api

价格表:

Google Gemini


Google I/O 2024 上更新了 Gemini 1.5 Pro 系列模型,会议摘录见《Google I/O 2024 亮点摘录》

信息来源:https://ai.google.dev/pricing

价格表:

Mistral


Mistral AI 是由前 Google DeepMind 和前 Meta 员工组建的位于法国的初创公司。Mistral 型有 Mistral 7B、Mixtral 8x7B 和 Mixtral 8x22B,性能表现如下图所示

在官方 API 中我们看到除了开源的模型外还有闭源模型。

信息来源

https://mistral.ai/technology/

https://console.mistral.ai/billing/subscribe/

价格表:

Groq


Groq 是前 Google TPU 团队成员组建的初创公司,主要提供面向 LLM 的定制芯片(称为语言处理单元 LPU)以及配套系统,LLaMA 3 70B 推理速度超过 300 tokens/s。

信息来源:https://wow.groq.com/

价格表:

百度千帆


信息来源:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7

价格表:

腾讯混元

信息来源:https://cloud.tencent.com/document/product/1729/97731

价格表:

阿里通义千问


信息来源:https://help.aliyun.com/document_detail/2712573.html

价格表:


讯飞星火


信息来源:https://xinghuo.xfyun.cn/sparkapi

价格表:


字节豆包


信息来源:https://www.volcengine.com/docs/82379/1099320

价格表:


月之暗面 Kimi


信息来源:https://platform.moonshot.cn/docs/pricing

价格表:

智谱 


信息来源:https://open.bigmodel.cn/pricing

价格表:


MiniMax


信息来源:https://www.minimaxi.com/document/price

价格表:

零一万物


信息来源:https://platform.lingyiwanwu.com/docs#%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7

价格表:


百川


信息来源:https://platform.baichuan-ai.com/price

价格表:


DeepSeek


信息来源:https://platform.deepseek.com/api-docs/zh-cn/pricing/

价格表:

汇总表格


下表汇总了目前已知大模型推理服务 API 价格信息:

厂商模型版本时效性(截止时间)上下文长度(tokens)每 100 万 tokens 定价多模态支持情况
OpenAIGPT-4o2023 年 10 月128K输入 5$, 输出 15$TIAV->TA
GPT-4 Turbo2023 年 12 月128K输入 10$,输出 30$TI->T
GPT-3.5 Turbo2021 年 9 月16K输入 0.5$,输出 1.5$T->T
AnthropicClaude 3 Haiku未知200K输入 0.25$,输出 1.25$TI->T
Claude 3 Sonnet未知200K输入 3$,输出 15$TI->T
Claude 3 Opus未知200K输入 15$,输出 75$TI->T
Claude 2.1未知200K输入 8$,输出 24$TI->T
Claude 2.0未知100K输入 8$,输出 24$T->T
Claude Instant未知100K输入 0.8$,输出 2.4$T->T
GoogleGemini 1.5 Flash未知128K输入 0.35$,输出 0.53$TI->T
Gemini 1.5 Flash未知1M输入 0.7$,输出 1.05$TI->T
Gemini 1.5 Pro未知128K输入 3.5$,输出 10.5$TI->T
Gemini 1.5 Pro未知2M输入 7$,输出 21$TI->T
Gemini 1.0 Pro未知32K输入 0.5$,输出 1.5$TI->T
Mistralopen-mixtral-8x7b未知32K输入 0.7$,输出 0.7$T->T
open-mixtral-8x22b未知64K输入 2$,输出 6$T->T
mistral-small-2402未知32K输入 1$,输出 3$T->T
mistral-medium未知32K输入 2.7$,输出 8.1$T->T
mistral-large-2402未知32K输入 4$,输出 12$T->T
GroqLLaMA 3 70B未知8K输入 0.59$,输出 0.79$T->T
Mixtral 8x7B未知32K输入 0.24$,输出 0.24$T->T
LLaMA 3 8B未知8K输入0.05$,输出 0.1$T->T
Gemma 7B未知8K输入 0.1$,输出 0.1$T->T
百度ERNIE 4.0未知4K输入 120¥,输出 120¥T->T
ERNIE 3.5未知4K输入 12¥,输出 12¥T->T
腾讯hunyuan-pro未知32K输入 100¥,输出 100¥T->T
hunyuan-standard未知32K输入 10¥,输出 10¥T->T
hunyuan-standard-256k未知256K输入 120¥,输出 120¥T->T
hunyuan-lite未知4K输入 8¥,输出 8¥T->T
阿里巴巴qwen-turbo未知8K输入 8¥,输出 8¥T->T
qwen-plus未知32K输入 20¥,输出20¥T->T
qwen-max未知8K输入 120¥,输出 120¥T->T
qwen-max-longcontext未知32K输入 120¥,输出 120¥T->T
MiniMaxabab6.5未知8K输入 30¥,输出 30¥T->T
abab6.5s未知245K输入 10¥,输出 10¥T->T
abab6未知32K输入 100¥,输出 100¥T->T
abab5.5未知8K输入 15¥,输出 15¥T->T
abab5.5s未知8K输入 5¥,输出 5¥T->T
零一万物yi-large未知16K输入 20¥,输出20¥T->T
yi-large-turbo未知16K输入 12¥,输出 12¥T->T
yi-large-rag未知16K输入 25¥,输出 25¥T->T
yi-medium未知16K输入 2.5¥,输出 2.5¥T->T
yi-medium-200k未知200K输入 12¥,输出 12¥T->T
yi-spark未知16K输入 1¥,输出 1¥T->T
yi-vision未知4K输入 6¥,输出 6¥TI->T
百川智能Baichuan2-Turbo未知8K输入 8¥,输出 8¥T->T
Baichuan2-Turbo-192k未知192K输入 16¥,输出 16¥T->T
Baichuan2-53B未知?输入20¥,输出 20¥T->T
深度求索deepseek-chat未知32K输入 1¥,输出 2¥T->T
deepseek-coder未知16K输入 1¥,输出 2¥T->T
智谱GLM-4未知128K输入 100¥,输出 100¥T->T
GLM-4(Batch)未知128K输入 50¥,输出 50¥T->T
GLM-4V未知2K输入 100¥,输出 100¥TI->T
GLM-3-Turbo未知128K输入 1¥,输出 1¥T->T
GLM-3-Turbo(Batch)未知128K输入 0.5¥,输出 0.5¥T->T
月之暗面moonshot-v1-8k未知8K输入 12¥,输出 12¥T->T
moonshot-v1-32k未知32K输入 24¥,输出 24¥T->T
moonshot-v1-128k未知128K输入 60¥,输出 60¥T->T
讯飞星火大模型V3.5未知?输入 240¥,输出 240¥T->T
字节豆包Doubao-lite-4k未知4k输入 0.3¥,输出 0.6¥T->T
Doubao-lite-32k未知32K输入 0.3¥,输出 0.6¥T->T
Doubao-lite-128k未知128K输入 0.8¥,输出 1¥T->T
Doubao-pro-32k未知32K输入 0.8¥,输出 2¥T->T
Doubao-pro-128k未知128K输入 5¥,输出 9¥T->T





模态解释





T:Text





I:Image





A:Audio





V:Video





E:Embedding






使用 GPT-4o 对该表格做进一步分析,绘制图表:

注意:本文统计数值可能会随时间波动,如需最新数据,请关注公众号私信获取。如内容有疏漏或错误,还请见谅,会在收到通知后第一时间更新。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询