微信扫码
与创始人交个朋友
我要投稿
DeepSeek-R1 重磅发布,性能对标 OpenAI o1 正式版,这是小贤看到的关于此领域最好的成果,没有之一。 核心内容: 1. DeepSeek-R1 开源及模型权重情况 2. 上线 API 及后训练阶段的技术 3. 开源许可证和用户协议调整
今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。
在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
https://huggingface.co/deepseek-ai
为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:
模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入 DeepSeek License 为开源社区提供授权,但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。
产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-21
DeepSeek开源推理模型 R1,比肩OpenAI o1正式版。
2025-01-21
OpenAI开源:20分钟构建多Agent语音系统!
2025-01-18
Wren AI Text-to-SQL: 颠覆数据库交互的秘密武器!(开源)
2025-01-17
企业为何需要小型语言模型(SLMs):AI 应用的新趋势与策略
2025-01-17
斯坦福大学开发的智能体Agent:写文献综述,它来了!
2025-01-17
首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!
2025-01-16
AI自主化:深入解读腾讯开源的通用Agent系统 Cognitive Kernel
2025-01-16
构建企业私有RAG大模型: (可商用)DeepSeek-V3开源部署,真的强吗?
2024-07-25
2024-05-06
2024-08-13
2024-06-12
2024-07-11
2024-07-20
2024-09-20
2024-06-16
2024-06-10
2025-01-01
2025-01-16
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13