我要投稿

DeepSeek干掉OpenAI，还要多久？

发布日期：2025-03-22 07:20:42 浏览次数： 2575 作者：技术领导力

最近，K哥参加了好几场AI领域的行业大会，发现不少人普遍存在一种“轻舟已过万重山”的乐观情绪。我很明白，这种氛围很大程度上是因为国产大模型DeepSeek的卓越表现所带来的。

不可否认，DeepSeek凭借技术创新，扭转了中国AI落后于美国2到3年的局面，但目前真到了“中国AI全面赶超美国”的阶段了吗，咱们的DeepSeek真的彻底打败OpenAI了吗？K哥来谈谈自己的观察与思考。

知己知彼：DeepSeek离OpenAI还有多远？

1、跟美国第一梯队大模型仍有差距

从综合测评角度看，DeepSeek在某些任务上的表现已经超越Meta的Llama系列，比如在自然语言处理的多项基准测试中，DeepSeek的开源模型展现了不俗的性能。但是，如果将其与OpenAI的GPT-4、Anthropic的Claude 3以及Google的Gemini 2.0 Flash放在一起比较，彼此之间的差距还是显而易见的。

以Gemini 2.0 Flash为例，这款模型不仅在推理任务中表现出色，同时成本也控制得更低。根据2024年Google I/O大会上公布的数据，Gemini 2.0 Flash的响应速度较之前提高了一倍。

训练成本也较上一代显著降低，这让它“最具成本效益”。除了整体性价比大幅提升外，Gemini 2.0 Flash支持视频、音频、文本深度融合的全模态数据处理能力，也是让目前主要局限在文本领域，尚未在多模态场景上发力的DeepSeek，略显逊色。

2、缩短了跟OpenAI的技术代际差

但话说回来，DeepSeek在技术上的创新突破，确实值得我们骄傲。过去，OpenAI的GPT系列几乎以代际碾压的姿态领先全球，尤其是GPT-3到GPT-4的技术飞跃，让其他玩家望尘莫及。但DeepSeek后来居上，以“算法优化替代算力堆砌”的技术路线，用更低的成本实现了对标GPT-4o1的推理能力。

更重要的是，DeepSeek选择了开源方向。这一策略不仅让DeepSeek自身技术快速迭代，更好地推动整个AI技术生态的发展。

3、打败OpenAI的不会是另一个OpenAI

DeepSeek的确在技术上做了很多创新，比如采用了混合专家模型（MoE）架构，将大模型拆分成多个“专家”，训练时分工协作，推理时按需调用，从而提高效率；还引入了多头潜在注意力机制（MLA），优化长文本处理效率，减少显存占用，等等。但另一个不能忽略的事实是，这些技术依然是依赖Transformer架构，并在此基础上进行创新和优化而来的。这种通过人工优化换取训练效率的做法，从本质上看仍是技术跟随路线。

但随着AI技术的发展，Transformer架构的局限性已逐渐显现。行业普遍认为，当模型的参数规模达到一定程度后，性能提升的边际收益可能会逐渐降低。对DeepSeek而言，在既有架构基础上，通过技术优化提升性能的空间，已经越来越小。换句话说，在这条技术路线上，用OpenAI的“招数”打败OpenAI的可能性是极低的。

历史经验表明，颠覆性的创新往往来自于对现有技术范式的突破。就像当年的苹果公司，通过重新定义手机的交互方式，彻底改变了手机行业的格局一样，AI领域同样需要这样的颠覆性创新，而不是在现有架构下的渐进式改进。AI大神Yann LeCun也曾指出，大模型未来的突破可能来自全新的计算范式。DeepSeek或其他大模型，要想真正从根本上超越OpenAI，可能要在技术路线上另辟蹊径，下大功夫了。

实际上中国AI公司已经开始尝试不同技术路线，比如国内大模型“六小虎”之一的MiniMax提出了“线性注意力“机制，尤其在长文本领域的表现非常突出，值得期待，而且MiniMax也在走开源路线。

DeepSeek改写了AI历史进程

1、成为AI界“开源一哥”

目前来看，DeepSeek在AI开源领域的领头羊、一哥的位子算是无可争议的。OpenAI自GPT-3之后转向闭源，Meta和Mistral虽然坚持开源，但始终难以与GPT系列抗衡，直到DeepSeek的出现，才真正壮大了“开源派”实力。

DeepSeek推出的DeepSeek-V3、DeepSeek-R1等多个开源模型，在Hugging Face平台上受到开发者广泛欢迎，DeepSeek-R1更是很快收获万赞，成为该平台“近150万个模型中最受欢迎的大模型”。在GitHub同样如此，DeepSeek的开源项目在上线不到三个月，就吸引了超过10万次的fork和star，成为同期最热门的AI开源项目之一。

通过开源社区的反馈，DeepSeek形成了快速迭代的闭环，也让“长尾效应”得以彰显，吸引了大量开发者进入，这些开发者可能各自开发的应用受众较小，但汇聚起来却形成了一个丰富、完善的应用生态。

2、降低了大模型训练成本

DeepSeek的FlashMLA技术，让H800 GPU推理效率提升30%，显存带宽飙至3000GB/s。训练成本更是比传统的Transformer模型降低了约40%。更难能可贵的是，DeepSeek开源了它的技术和创新，对于资源有限的中小企业来说是一个巨大的福音，能让他们以极低成本调用高性能模型，让更多企业能够参与到大模型的训练和应用中来。

不夸张地说，DeepSeek凭借在工程和算法上的创新，引发了一场低成本训练大模型的“普惠革命”，让整个AI产业大受其益。仅就这一点，DeepSeek绝对配得上世界范围内用户对它的推崇和喜爱。

3、王炸级Chatbot 体验升级

DeepSeek另一个引人注目的特色，是在C端用户体验上的显著突破。它推出的Chatbot不仅支持联网功能，还通过“Chain of Thought”（CoT）将推理过程透明化，让用户能直观看到模型如何一步步得出答案。这种透明化的体验，既增强了用户对AI的信任感，又符合了“用户中心”的设计理念，通过满足用户的好奇心和控制欲，提高了用户的满意度和忠诚度。

DeepSeek推理可视化的用户体验，惊艳的生成效果，再加上免费使用策略，堪称王炸组合，瞬间吸引大量C端用户。在没有任何营销推广的前提下，在全球范围内，创造了“上线7天，用户破亿”的AI应用神话。

DeepSeek 重塑中美AI产业格局

1、动摇ChatGPT世界第一ChatBot的品牌心智

ChatGPT长期以来被视为AI科技的代名词，牢牢占据着“全球第一”Chatbot的“品牌心智”，被视为无可替代的存在。但它不菲的使用成本（基础版定价每月20美元）让不少用户望而却步。DeepSeek免费模式的推出，更是给了ChatGPT重重一击，其零成本策略迅速吸引了大量ChatGPT用户迁移。

彭博社数据显示，DeepSeek应用曾在全球140个市场下载量登顶，而ChatGPT的用户使用量则“此消彼长”般显著下滑。急得OpenAI创始人山姆奥特曼公开承认“压力很大”，甚至“想和DeepSeek的管理者见个面”。DeepSeek用事实和数据证明，ChatGPT并不是ChatBot世界必然的“第一”，更不会是用户选择的“唯一”。

2、给闭源大模型公司带来冲击

柯达因固守胶片，而错失数码时代；诺基亚因拒绝智能手机，而被市场颠覆；这些都已经成为商业史上因不能顺应趋势、不肯变革，而导致一败涂地的经典案例。如今，很多闭源大模型公司，也在经历“变与不变”的艰难抉择。

面对DeepSeek开源的成功，一些闭源大模型公司不得不重新审视自己的战略。开源模式对他们的冲击，不仅体现在技术层面，还体现在市场层面。技术上，闭源的技术神秘感被打破，甚至连用户体验都被开源的DeepSeek所超越。这样下去，用户对开源技术的接受度和信任度只会越来越高，面对这一尴尬处境，还“犹抱琵琶半遮面”的闭源公司又该如何应对？别忘了，用户可是会用脚投票的。

再看市场层面，在最近的财报季中，多家闭源AI公司都提到了开源趋势对它们业务的影响，并表示将加快开源化进程。有些动作快的公司，已经先下手为强了。比如OpenAI已经宣布对部分大模型开源，Anthropic也表示将开源部分核心模块，Google也跟进加速推进Gemini开源计划。

闭源大模型公司的这种“群体应激反应”式的自救，不是出于良心发现，而是因为闭源模型的倒逼，某种程度来说，是DeepSeek以一己之力，让开源与闭源博弈的天平，向后者倾斜。从这个角度看，说DeepSeek 重塑了AI产业格局，一点也不为过。

方向是星辰大海

1、DeepSeek目标是AGI

不管是对人还是对企业来说，要想做成大事，必须要敢试错，要有底气。而对DeepSeek来说，他最大的底气就是背后的母公司幻方量化。DeepSeek背靠幻方量化，财大气粗，资金储备充裕，不用为“柴米油盐”一类的小问题或短期利益所影响。他们有足够的战略定力，专注于人工智能的基础性研究，并剑指更宏大的AGI领域。

DeepSeek在今年2月份已经宣布，成立探索AGI团队，并计划开源5个代码库，以推动AGI研究。这些都彰显了他们在AGI领域投入的决心和战略上的雄心。念念不忘，必有回响，更何况他们有雄厚的财力，和长期主义的远见，他们最需要的，也许只是时间。

2、创新与开源双引擎驱动

如果把格局再“升维”一下，DeepSeek的未来目标，也许并不是与OpenAI等AI巨头的短期较量，还有更高视野下的地缘政治博弈。如今算力即国力，AI技术领先，就代表未来整个科技、生产制造等领域的全面领先。DeepSeek坚持“创新+开源”双引擎驱动，为的就是在这一事关“国运”的关键领域保持领先，卡好位置。

而事实也证明，DeepSeek这一策略是正确的，这一模式不仅有助于打破美国的AI霸权和技术垄断，也为全球AI生态注入了新活力，并最终帮助中国AI从“规则接受者”跃升为“标准共治者”，意义深远，影响重大。

写到这里，K哥除了想表达对DeepSeek的敬意外，还想说的是：在这个时代，任何领域都很难再有“象牙塔”，只有车库文化与社区共创精神才能更激励人心，也唯有如此，企业或个人的生命，才会更有生存的韧性和突破的张力。DeepSeek的崛起，不是终局，只是序章，让我们一起期待更多属于我们的“DeepSeek”故事。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业