我要投稿

DeepSeek API 升级，支持续写、FIM、Function Calling、JSON Output

发布日期：2024-07-26 15:10:28 浏览次数： 3939

今天，DeepSeek API 迎来更新，装备了新的接口功能，来释放模型的更多潜力：

更新接口 /chat/completions

JSON Output
Function Calling
对话前缀续写（Beta）
8K 最长输出（Beta)

新增接口 /completions

FIM 补全（Beta）

所有新功能，均可使用 deepseek-chat 和 deepseek-coder 模型调用。

更新接口 /chat/completions

1.JSON Output，增强内容格式

DeepSeek API 新增 JSON Output 功能，兼容 OpenAI API，能够强制模型输出 JSON 格式的字符串。

在进行数据处理等任务时，该功能可以让模型按预定格式返回 JSON，方便后续对模型输出内容进行解析，提高程序流程的自动化能力。

要使用 JSON Output 功能，需要：

设置response_format 参数为 {'type': 'json_object'}
用户需要在提示词中，指导模型输出 JSON 的格式，来确保输出格式符合预期
合理设置 max_tokens，防止 JSON 字符串被中途截断

以下为一个 JSON Output 功能的使用样例。在这个样例中，用户给出一段文本，模型对文本中的问题 & 答案进行格式化输出。

2. Function Calling，连接物理世界

DeepSeek API 新增 Function Calling 功能，兼容 OpenAI API，通过调用外部工具，来增强模型与物理世界交互的能力。

Function Calling 功能支持传入多个 Function（最多 128 个），支持并行 Function Calling。

下图展示了将 deepseek-coder 整合到开源大模型前端 LobeChat 的效果。在这个例子中，我们开启了“网站爬虫”插件，来实现对网站的爬取和总结。

下图展示了使用 Function Calling 功能的交互过程：

3. 对话前缀续写（Beta），更灵活的输出控制

对话前缀续写沿用了对话补全的 API 格式，允许用户指定最后一条 assistant 消息的前缀，来让模型按照该前缀进行补全。该功能也可用于输出长度达到 max_tokens 被截断后，将被截断的消息进行拼接，重新发送请求对被截断内容进行续写。

要使用对话前缀续写功能，需要：

设置 base_url 为
https://api.deepseek.com/beta 来开启 Beta 功能
确保 messages 列表里最后一条消息的 role 为 assistant，并设置最后一条消息的 prefix 参数为 True，
如：{"role": "assistant": "content": "在很久很久以前，", "prefix": True}

以下为对话前缀续写功能的使用样例。在这个例子里，设置了 assistant 消息开头为 '```python\n'，以强制其以代码块开始，并设置 stop 参数为 '```'，让模型不输出多余的内容。

4. 8K 最长输出（Beta），释放更长可能

为了满足更长文本输出的场景，我们在 Beta 版 API 中，将 max_tokens 参数的上限调整为 8K。

要提高到 8K 最长输出，需要：

设置 base_url 为
https://api.deepseek.com/beta 来开启 Beta 功能
max_tokens 默认为 4096。开启 Beta 功能后，max_tokens 最大可设置为 8192

新增接口 /completions

1.FIM 补全（Beta），使能续写场景

DeepSeek API 新增 FIM补全接口，兼容 OpenAI 的 FIM 补全 API，允许用户提供自定义的前缀/后缀（可选），让模型进行内容补全。该功能常用于故事续写、代码补全等场景。FIM 补全接口收费与对话补全相同。

要使用 FIM 补全接口，需要设置 base_url 为 https://api.deepseek.com/beta 来开启 Beta 功能。

以下为 FIM 补全接口的使用样例。在这个例子中，用户提供斐波那契数列函数的开头和结尾，模型对中间内容进行补全。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-18

Claude Skills 会替代 MCP 吗？

2025-10-18

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

Claude 新功能 Agent Skills：让 AI 变成你团队的专属专家

2025-10-18

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

2025-10-18

Karpathy：智能体什么都干不好，AGI 至少还要十年

2025-10-18

Claude 的Skill 可能比 MCP 更重要

2025-10-18

百度沈抖：对AI的50条判断

2025-10-17

Claude 发布 Skills：知识工程让 AI Agent 变成“行家里手”

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

WAIC 2025 观察：大模型进入“效率与场景”决胜期

2025-07-29

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

DeepSeek突然更新V3.1：实测后才发现的亮点与槽点

2025-08-19

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

DeepSeek v3.1 到底有多强？与 Claude Code 一起实测！

2025-08-20

大家都在问

Claude Skills 会替代 MCP 吗？

2025-10-18

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

大模型会替代搜索引擎么?

2025-10-16

OpenAI“隐秘客户榜”曝光：谁在烧掉上万亿Token？

2025-10-16

Comet、Dia相继开放！AI浏览器到底在解决我们的什么问题？

2025-10-14

为何底层数据湖决定了 AI Agent 的上限？

2025-10-13

分发变现闭环: sora2不是“又一次热点”，而是质变？

2025-10-09

OpenAI搭台：AI应用繁荣周期的起点？

2025-10-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部