AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


DeepSeek荣光下:落寞的“六小龙” | AI光年

发布日期:2025-02-24 22:02:08 浏览次数: 1547 来源:深网腾讯新闻
推荐语

在AI大模型市场,DeepSeek的崛起与“六小龙”的落寞形成鲜明对比。

核心内容:
1. DeepSeek-V3和R1模型的发布及其对市场的巨大影响
2. “六小龙”与DeepSeek相比的困境和挑战
3. DeepSeek如何通过创新和价格战改变行业格局

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

图片

图片图片来源:视觉中国


特约撰文丨吴芊语  编辑丨叶锦言


出品丨深网·腾讯新闻小满工作室

图片

人类的悲欢并不相通。从2016年开启的人工智能元年,AI产业已经历好几轮洗牌,借着ChatGPT的东风,DeepSeek如同鲇鱼一般搅动了整个大模型市场,同为大模型创业公司并被业界视为新贵“六小龙”的厂商们,与其相比,境遇堪称东边日出西边雨。

DeepSeek年前推出低成本、性能媲美GPT-4o的DeepSeek-V3震惊业界后,其接着在1月20日发布R1模型,上线六天后登顶苹果App Store全球下载榜首,上线一个月累计下载量超1.1亿次。在这期间各大云厂商迅速上线开源版V3和R1,百度搜索、微信等产品都在积极拥抱DeepSeek。

而和DeepSeek同时期发布的Kimi全球强化学习模型k1.5、阶跃推理模型Step R-mini,在模型能力上诸多层面接近o1,但依然淹没在了DeepSeek火爆的舆论中。

与DeepSeek的喧闹相比,“六小龙”也是接二连三的爆出消息:零一万物进一步拆分、月之暗面预算和仲裁案未和解、MIniMax又一高管离职……

而这背后还有失意的VC们:真金白银支持的项目,没有一个达到DeepSeek这样的热度。目前,“六小龙”中已经4家超半年没有融资消息释放。2024年业界称“六小龙”中已有两家掉队,2025年,下一个掉队的是谁?

图片

只剩三家继续扎根大模型

DeepSeek的爆火并非没有征兆,自2023年11月2日推出首个模型DeepSeek Coder后,一年多时间上线了超10个不同版本的模型。其中去年5月发布的V2模型,性能上比肩GPT-4 Turbo,价格却只有GPT-4的1%,因此DeepSeek被称作“价格屠夫”“AI界拼多多”,同时掀起了大模型行业的第一轮价格战。

2025年1月27日DeepSeek超越ChatGPT,登顶中国区和美国区苹果APP Store免费榜,引发全球关注。让DeepSeek有如此成就的是其推理大模型DeepSeek-R1。根据DeepSeek公布的信息,R1在多项权威测试中得分与o1正式版接近,部分测试中得分还超过o1正式版。

榜单评分外,开源+性价比则是让DeepSeek引发泼天热度的重要组合拳。受到DeepSeek的冲击,曾经的闭源信徒百度创始人李彦宏也宣布加入开源队伍,OpenAI创始人山姆.奥特曼也反思道,公司在开源领域的策略上一直处于“错误的一方”。

大模型“六小龙”中的MiniMax在1月15日发布了首个开源模型,其创始人闫俊杰在接受《晚点》采访时也表示,“第一次创业很多经验不具备,如果可以重新选,应该第一天就开源。”其他五小龙中,只有智谱是最早开源闭源两条腿走路的。经过近两年的摸爬滚打后,“六小龙”发展方向已南辕北辙。

零一万物是第一家公开大幅调整的基础大模型公司,先是裁撤了预训练算法团队和Infra团队,部分人员以跳槽形式加入阿里,后宣布与阿里云、苏州高新区分别联合成立产业大模型联合实验室、产业大模型基地。

人员方面,模型训练负责人黄文灏、负责大模型API开放平台的蓝雨川、生产力产品负责人曹大鹏都相继离职。试图留在牌桌上的零一万物,掩盖不住在这一轮大模型竞赛中的颓势。

百川智能则在2024年明确了走医疗赛道,近期上线了首个“AI儿科医生”。在To B的商业化上百川则似乎不太顺利,其联合创始人、商业化负责人洪涛年前已经离职。据百川一位员工告知的确不及预期,“现在有了DeepSeek后,今年的压力只增不减。”

To B商业化负责人离职的还有MiniMax的魏伟,此前魏伟接受采访时表示,很多B端客户不会轻易掏这个钱,去支撑大模型公司的营收,只能基于研发能力、算法能力来帮助客户在实际场景中对齐输出效果,也印证了大模型商业化并非易事。

如此看来,仍在专注于大模型技术创新和追求AGI的,仅剩下月之暗面、智谱、阶跃星辰。受到DeepSeek的影响,阶跃星辰也加入了开源阵营,只是与DeepSeek重点在文本模型上不同的是,阶跃星辰最新开源的是两款多模态模型——Step-Video-T2V、Step-Audio。

2月23日凌晨,月之暗面发布最新论文《Muon is Scalable for LLM Training》,并开源MoE模型Moonlight,模型激活参数仅需3B。不少业内人士认为这是在“截胡开源周”,因为早前DeepSeek宣布将连续5天发布开源项目。

对月之暗面而言,火烧眉毛的或许是其大手笔投流的Kimi产品。

图片

烧钱投流难成榜一大哥

与大模型“六小龙”一样DeepSeek也有同名C端产品,在上线后的第一周并没有在市场上引起过多的关注。据QuestMobile向媒体披露的数据显示,2025年1月13日至1月19日,DeepSeek App周下载量仅为28.5万,远不及豆包(452万)以及Kimi(155.7万)。

在2025年1月20日R1发布后,DeepSeek下载量开始陡峭式增长,Sensor Tower研究显示DeepSeek在发布会18天内下载量超1600万次,几乎是OpenAI的ChatGPT首次发布时的900万次的两倍。

访问量激增,一度让DeepSeek闪崩,而即便如此,增长的势头依然很猛,月下载量超1.1亿。DeepSeek的光芒再也没有哪家可以视而不见,2月13日字节跳动内部全员会上,CEO梁汝波谈及DeepSeek时,反思跟进速度不够,今年要追求智能上线。

腾讯的微信灰度测试接入了DeepSeek的AI搜索,在使用量超预期后又调用了AI应用元宝支持微信搜索。2月22日,腾讯元宝超越字节的豆包,升至中国区苹果免费APP下载排行榜第二,DeepSeek继续位居榜首。

“榜一榜二大哥”在短短一个月内易主,迫使烧钱换增长的豆包和Kimi优势不再。两者的区别是,前者是含着“金钥匙”出生的贵族,后者则是“创业新贵”。此前有媒体测算,仅在iPhone渠道,Kimi每天的投放金额接近20万,豆包则为248万。

在DeepSeek的影响下,月之暗面近期被爆大幅削减产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。据内部人士向《AI光年》透露,推广确实做了相应调整,“有自然新增,但无法和DeepSeek的涨势相比。”

kimi当下的烦恼可不止这些:「暗涌Waves」独家获悉,搁置颇久的Kimi仲裁案,并未和设想的一样,完成和解,而是进入到仲裁案的下一流程中。据知情人透露:Kimi仲裁案的双方,循环智能老股东和杨植麟等,已分别于1月底和2月下旬,在HKIAC(香港国际仲裁中心)完成缴费,目前组庭也已完成。而整个事件背后更关键的主角张予彤,或将被另外单独提起诉讼。

对To C产品同样予以厚望的还有MiniMax,原因是其旗下明星产品Talkie2024年上半年成为美国下载量第四的AI应用,使之吃到了甜头。但好景不长,12月中旬Talkie在美国市场的苹果应用商店中悄然消失,而安卓平台则未受影响。

阶跃星辰、零一万物、智谱AI和百川智能也都有自家的AI应用产品,但根据AI产品榜显示2025年1月,月活前20的AI应用中没有一家是与这四家厂商相关的。此前百川智能的员工告诉《AI光年》,“百小应的用户留存和增长很差也不意外,我们基本不做广告投放,先让其他家烧钱完成用户教育。”

目前DeepSeek、腾讯元宝、字节豆包霸占了苹果免费APP下载排行榜前三。大模型“六小龙”想要上榜,竞争只会更激烈,目前排名第七的纳米搜索,周鸿祎正在亲自下场“带货”。

另外还有一个不容忽视的对手就是阿里,AI应用通义并入阿里智能信息事业群后,近期阿里AI To C业务开启了大规模招聘,岗位达数百个,集中在AI大模型相关的产品、技术研发岗位。前有狼后有虎,正是大模型“六小龙”当下处境的真实写照。

当技术故事不再浪漫、商业化不及预期、产品月活用户增长与投入不成正比,大模型“六小龙”理想丰满,现实骨感。

图片

下一轮融资门槛提高

大模型预训练烧钱是公认的事实,李开复曾透露,一次预训练成本约三四百万美元,即便是成本更低的Yi-Lightning,在训练时也用了2000张GPU,耗时一个半月,花费三百多万美元。

即便标榜低成本的DeepSeek,在前期的投入也是难以估量的,第三方机构SemiAnalysis推算,DeepSeek实际拥有庞大的算力储备:共堆砌了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“特供版”H800以及3万张“特供版”H20。

“通用大模型的训练成本,我们预估的大概10亿美金左右,这仅仅是算力部分,还没算另外两个很花钱的部分,一个是数据,一个是人力成本,现在全球大模型领域的人才,是非常稀缺的。”将门创投创始合伙人、前微软创投大中华区负责人杜枫博士曾告诉作者。

由于需要如此高昂的投入,导致很长一段时间里业内流行一种说法:投资大模型企业的入场券是1亿美金。这句话背后的另外一个信号是,一个大模型创业公司拿不到融资,是难以活下去的。

2023年百模大战掀起后,几乎每隔一个月都会有融资消息释放出来,但随着AI泡沫论甚嚣尘上,2024年9月起,很长一段时间没有数亿级的热钱流向大模型“六小龙”。直到2025年春节前,智谱和阶跃星辰先后宣布拿到了“过冬钱”,前者宣布完成新一轮30亿元人民币融资,后者则完成B轮数亿美元融资。

“六小龙”中另外4家已经距离上一次融资动态发布有超半年:MiniMax去年3月官宣完成6亿美元B轮融资、百川智能去年7月获得50亿元A轮融资、零一万物去年8月完成新一轮数亿美元融资、月之暗面去年8月完成3亿美元融资。

春节期间,DeepSeek火爆全球,舆论毫不吝啬夸奖DeepSeek及其创始人梁文峰。在创投圈关于DeepSeek会不会开启融资、估值多少,近日一直有不少消息流传出来。

此前有消息称阿里将以100亿美元估值,投资10亿美元占股10%。对此阿里副总裁颜乔很快通过朋友圈辟谣称,“外界流传阿里投资 DeepSeek的信息是假消息”。而后外媒称“DeepSeek首次考虑筹集外部资金”,DeepSeek相关人士辟谣,融资消息均为谣言。

“不少投资人都直接或者托关系在约梁文峰,我预测估值应该是远超于目前‘大模型六小龙’的。”中金资本一位投资人表示,“DeepSeek成为了对标对象,六小龙要在一级市场拿到新融资,门槛显然更高了。”

事实上,自大模型创业潮掀起以来,行业内普遍不太相信“六小龙”最后都能作为独立“大模型公司”生存下来的。“六小龙”中几位创始人也在公开场合表达过类似的观点,比如MiniMax创始人闫俊杰认为未来全球只会剩下5家大模型企业。

“中国一定会有自己的ChatGPT。这跟搜索引擎一样,我们有自己的合规要求。但是中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为。”迅雷创始人、远望资本程浩曾告诉作者。

持续爆火下,本就走向分化的“六小龙”将加速洗牌。


图片

图片图片

图片图片图片图片图片

图片

小满工作室 | 腾讯新闻出品

本文版权归“腾讯新闻”所有,如需转载请在文后留言,经允许后方可转载。

第1278期

运营排版:文文

  你“在看”我吗?


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询