AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


DeepSeek距离AGI,只差一个“腾讯”
发布日期:2025-02-09 05:55:57 浏览次数: 1543 来源:乌鸦智能说
推荐语

DeepSeek的崛起正在重塑全球AI格局。

核心内容:
1. DeepSeek引发的国内外关注和反应
2. DeepSeek对中美科技竞争的影响
3. DeepSeek面临的投资和运营挑战

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

在DeepSeek刷屏后,黑悟空制作人冯骥第一时间点评说:


这是国运级的创新。


这话不假。过去短短的十天里,DeepSeek让很多事情都发生了微妙的变化。


备受AI行业追捧的Anthropic CEO Dario Amodei发布了一篇文章,强烈呼吁不应该让任何一块美国的芯片出口到中国,以维系AI的“单极世界”。


几个月前,这位科学家刚刚还写过一篇文章,宣示了他和他的公司通过强大的人工智能解决全人类身心健康、心理疾病、贫困、和平等诸多方面的美好善意。


这件事,怎么看都让人觉得割裂。


不仅如此,随着DeepSeek的出圈,外资已经开始对整个中国资产进行重估。


Linkedin创始人Reid Hoffman在CNBC说“China is in the game(中国上牌桌了)”,木头姐也在BBG TV上说“we're looking more closely at China(我们正更加密切关注中国)”。


开年后的5个交易日里,恒生科技指数涨了10%。上一次恒生科技指数涨这么凶,还是在去年9月。


毫无疑问,DeepSeek被推到台前,改变了中美科技竞争的时间线。但回归现实,也带来了另一个现实问题:


自成立以来,DeepSeek还没有拿过任何投资。越来越多难以招架的新增用户、庞大的数据和算力需求,对于立志想实现AGI(通用人工智能)的梁文锋来说,仅靠幻方量化一家的力量,无疑将变得捉襟见肘。


换句话说,DeepSeek需要一个真正的战略投资方。但这事又不太容易,因为DeepSeek是“特殊”的。这家公司身上存在着大量的“非共识”:


组织架构讲究自下而上,推崇自然分工,不做前置分工;DeepSeek不做应用,只做模型,甚至还没有全面考虑过商业化等等。


这对战略投资方提出了极高的要求:不仅要有足够的数据和资金,文化还要足够包容,且对DeepSeek没有过多的业务需求。


放眼望去,整个互联网领域,腾讯无疑是那个最理想的选择。


腾讯的资源不必多说,由于社交链的稳固,腾讯对AI没有迫切的业务需求,追求“产业实用”战略也契合DeepSeek产业分工的设想。


DeepSeek需要腾讯,腾讯又何尝不需要DeepSeek。相比阿里、字节在大模型领域的凶猛,腾讯一直采取Follow态度,声量远低于前两者。


在投资圈,有一句经典名言:“当闪电落下的时刻,你最好在场”。意思是说,当市场机会来临时,你必须在场,手握筹码。


DeepSeek,就是腾讯当下需要的筹码——在AI应用全面爆发前夕,效率将成为应用落地的关键。拿下中国大模型算力优化上最成功的公司,意义不言而喻。


4年前,腾讯对《黑神话悟空》的投资,不仅收获了过去几年最成功的投资案例,也再次证明了腾讯是游戏开发商的最理想投资方,面子里子都有了。


而如今,类似的机会出现在DeepSeek上。无论从哪种角度上说,腾讯都应该尽早对DeepSeek出手。


/ 01 /

DeepSeek需要一个战略投资方


上线短短20天时间里,日活就超过2000万,成为全球增速最快的AI应用。


DeepSeek已经越来越难以招架蜂拥而来的新增用户了。无论在官方app和网页里,10条回复有8条是“服务器繁忙,请稍后重试”。


说实话,这也不能怪DeepSeek。DeepSeek的目标是实现AGI,不是云服务,宝贵的算力资源都得用在探索模型上,而不是保障几亿用户的推理需求。


庞大的用户服务压力,并不是DeepSeek面临的唯一问题。通过AGI的道路上,DeepSeek还需要更多的数据和算力。


很多人说DeepSeek训练成本很低,600万美元干翻AI巨头。


虽然这个故事真的很性感,但我们也必须清楚,DeepSeek论文里提到的成本,只是最终版本的训练成本,没有包括研发成本,前期硬件购置成本,以及前期测试和迭代的训练成本。所谓几百万的成本,大概率只是实际训练成本的零头。


考虑到DeepSeek更多扮演着追赶者的身份,相比于探索者,追赶者的算力需求要少得多。一旦DeepSeek进入探索前沿,需要的时间和人力成本会高很多。这也是奥特曼要斥资5000亿美元大搞算力基建的核心所在。


根据之前暗涌对梁文锋采访,现在DeepSeek的钱全部来自幻方:


幻方作为我们的出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如果需要,也可以做些调整


虽然幻方搞量化很赚钱,一年能赚大几十亿人民币,但给投资人分一分,留到自己手上的大概率过不了二十亿。放在大部分公司上,这肯定不是一个小数目。


但比起现有大模型玩家来说,单靠幻方,DeepSeek能拿到的资源很有限。


对现在只支持问答、读图、读文档的DeepSeek来说,未来随着大模型能力扩展到图片生成、音频生成和视频生成领域,其对算力和资金的需求都将呈指数级飙升。


对梁文锋和DeepSeek来说,找到一个真正的战略投资方,变得越来越迫切。


/ 02 /

反规模胜利与DeepSeek的融资“困境”


DeepSeek不是没有想过融资,但最终没有成功。


当时,梁文锋给出的解释是:


接触下来,感觉很多VC对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化,而按照我们优先做研究的思路,很难从VC那里获得融资


站在当时视角看,投资DeepSeek并不是一个简单的决定。原因很简单,在DeepSeek这家公司身上,存在着很多“非共识”:


1)所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。
2)与大厂模型围绕业务需求不同,DeepSeek全是自下而上,不做前置分工,而是自然分工。
3)优先做研究,不做应用,只做模型,未全面考虑商业化,坚定选择开源路线
4)相信AI产业基础模型和基础服务会出现专业化分工,基础大模型需要持续创新,而大厂有它的能力边界。
5)在梁文锋设想里,DeepSeek未来可以只负责基础模型和前沿的创新,然后其他公司在DeepSeek的基础上构建To B、To C的业务。


回过头来看,这些“非共识”虽然没能给DeepSeek带来投资,最后却成了DeepSeek成功的关键。


正如微软Windows部门前总裁Steven Sinofsky所说,当下AI正在陷入了一种规模化困境,彻底变成了一场大型军备竞赛。


入局的公司要么是科技巨头,比如谷歌、Meta与微软,要么是完成了大额融资的初创公司,像是OpenAI和Anthropic。


但回顾计算机发展历史,纵向扩展(scale up)最终会被横向扩展(scale out)所颠覆,「更快更强」会被「小巧但多」所取代。


在纵向扩展下,电脑从占据一整个房间的ENIAC,演进到晶体管计算器,到可以放在办公桌上的集成电路计算机、再到沿用至今的微型处理器。


但性能更强的电脑,普及率和数量都不如横向扩展后的智能手机。


带入到AI,这种纵向发展的思路,是大厂所擅长的,但也让他们陷入了大公司的惯性里,一直在做性能提升,而没有质的飞跃。


当年,美国通讯巨头AT&T曾认为,构建互联网应该去扩展电话网络,增加通讯设备,让信号更稳更强。原因很简单,他们坐拥通讯网络的基础设施。


但事实与他们设想截然相反。


真正的互联网,恰恰是通过一个个不起眼的技术创新构建起来的:


当时的小公司思科发明了路由器,蒂姆·伯纳斯-李发明了HTTP、HTML等协议和编码,网景开发的浏览器……这些个人和小公司当时都没有大量的资金和基础设施,但靠有限的资源构建起了互联网。


DeepSeek在这个意义上,摆脱了规模化的困境,创造了新的可能。回到当下,固然DeepSeek很多“非共识”正在得到验证,但想要找到合适的战略投资者也并不容易。


/ 03 /

腾讯和DeepSeek,双向奔赴的选择


纵观中国的科技公司里,能够给DeepSeek提供足够资源的公司并不多,无非是阿里、字节和腾讯。


看上去,阿里和字节无比合适,这是去年国内互联网领域投资AI最猛的公司。


AI六小龙(智谱、月之暗面、百川智能、零一万物、MiniMax、阶跃星辰)中,阿里几乎投了个遍。


而字节更不用说,集中资源全力投入AI。据浙商证券统计,2024年字节跳动在AI上的资本开支达到了800亿元,接近百度、阿里、腾讯的总和(约1000亿元)


虽然有钱,但单从AI发展的理解上,阿里、字节与DeepSeek有很大不同。


其一,阿里和字节都带着移动互联网的浓厚烙印,坚信大力出奇迹。阿里撒网式的投资,字节干脆直接把App工厂的逻辑带到了AI领域。而DeepSeek坚信,AI商业逻辑与互联网不同。


其二,无论是阿里和字节,都对AI业务有着极强的业务需求。对阿里而言,电商主业受到了冲击,只能猛干AI,在云计算上找补回来。字节则希望找到AI时代新的流量入口,内容平台的护城河实在太过脆弱了。而DeepSeek更希望做基础模型的创新研究,而非承担业务的需求。


与前两者相比,腾讯无疑是一个更现实、理想的选择。


由于社交链的稳固,腾讯对AI的发展没有迫切的业务需求,采取的是follow态度,耐心度极高。对于这个策略,马化腾曾打过这样一个比方:


在工业革命里,早一个月把电灯泡拿出来,在长的时间跨度上看是不那么重要的。


从落地策略上看,腾讯与DeepSeek又高度互补。DeepSeek只想做模型,而腾讯更注重场景落地。用腾讯自己的说法,发展大模型的核心战略是“产业实用”。简单来说,就是强调产业场景覆盖和应用落地。


更重要的是,腾讯的投资风格“佛系”,投资和业务则保持相对独立,能够最大程度地保持DeepSeek的独立性。游戏科学的成功,就是最好的案例。


DeepSeek需要腾讯,腾讯也同样需要DeepSeek。


回顾历次技术革命,当技术全面走向应用阶段,产业会快速进入以效率驱动的扩张期。在这个阶段,效率高低将决定一切,产业窗口也稍纵即逝。


1913年,福特引入流水线生产,T型车的装配时间从12小时骤降至1小时33分钟,价格也从 850美元降至360美元。这不仅仅是一次简单的降价促销,而是一场彻底的供给侧革命。


在这场供给侧革命中,只有那些及时跟进规模化生产的玩家活了下来:通用通过并购凯迪拉克、雪佛兰等品牌打造了全矩阵产品线,克莱斯勒则收购道奇完成扩张。


到1930年代,“底特律三巨头”坐拥超过80%的市场份额,寡头格局就此确立。一个世纪后的今天,AI领域可能正在经历类似的转折点。


在AI产业落地的过程中,推理模型成本的大幅下降至关重要。原因很简单,以低成本为优先要素的竞争分化则意味着能在更短的时间内找到应用场景,也就能为资本支出找到回报的路径。


对志在抓住AI落地机会的腾讯来说,拿下中国大模型算力优化上最成功的公司,也为其后续的应用端布局带来了更多机会。


4年前,腾讯坚持“三不”原则(“不干预运营决策、不抢占项目主导、不寻求发行运营”)投资了游戏科学。最终,腾讯不仅收获了过去几年最成功的投资案例,也再次证明了其才是游戏开发商的最理想投资方。


如今,这样的机会又再次摆在了腾讯的面前。有了《黑神话悟空》的成功在前,腾讯应该尽快对DeepSeek出手。


文/林白


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询