AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


DeepSeek将开源每日工作代码,聊聊背后的开源精神

发布日期:2025-02-22 08:11:38 浏览次数: 1617 来源:快刀青衣
推荐语

探索AI的未来,DeepSeek开源代码的深远意义。

核心内容:
1. DeepSeek的开源模型及其背后的“开源精神”解读
2. 《大教堂与集市》中对开源精神的阐释及其现实意义
3. DeepSeek开源代码对技术发展和社会进步的潜在影响

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



最近DeepSeek很火,已经火到了各行各业,以至于有一些很多年没有跟我联系过的好朋友,都开始在微信上私信我:“DeepSeek到底是个啥?”


我大部分时候都会说:“就是一款超强的开源模型,能自己推理、自己思考。开源就是把代码全放出来,大家随便用。”


当我这么说了之后,下一个问题一般都是:“为啥啊?他们做出来的东西为啥免费给别人用啊?”


其实,这背后就是“开源精神”。


可能听到这里,你也好奇,什么是“开源精神”?


对于这个问题,我推荐大家去读一本经典老书,名字叫《大教堂与集市》。


今天,我将结合《大教堂与集市》这本书的内容,跟你科普一下什么是开源精神,也进一步聊聊这轮DeepSeek开源模型的爆火,将对整个社会的技术发展带来什么影响。


01

这里没有象牙塔,只有纯粹的车库精神


在分享本书之前,我先跟大家分享一个最近看到的信息。


昨天中午,2025年2月21日12点,DeepSeek团队在X平台发布了一段英文内容。


我用DeepSeek把它翻译过来了,给大家分享一下:“我们是一个探索通用人工智能(AGI)的小型团队。从下周开始,我们将开源5个代码仓库,以完全透明的方式分享我们微小但真诚的进展。这些在在线服务中经过完整文档记录、部署和生产环境实战检验的基础模块,虽然谦逊但足够坚实。作为开源社区的一员,我们相信每一行共享的代码都将转化为加速探索进程的集体动能。每日解锁即将到来——这里没有象牙塔,只有纯粹的车库精神与社区驱动的创新。”



有些同学可能不是从事软件行业的,我来简单解释一下,DeepSeek说的其实就是:从下周开始,他们将把每天的工作代码开源出来。


能做出这样的行动,是非常有魄力的。


你可能要问,这跟之前开源DeepSeek R1模型有啥区别?


我给你打个比方,之前开源的是工作成果,就像一个老师傅,把他所有的经验无私传授给你。而现在,你不但能拿到老师傅的秘籍,还能看到老师傅在过程中是怎么干活儿的。这对很多人来说,会比结果更有价值。


不出所料,看到这条内容的各国网友都反响热烈。第一条评论就写道:“这才是真正的Open AI!”他们故意把“Open”和“AI”之间加了个空格,这话说得恰到好处,不仅是对DeepSeek的赞美,还顺便对山姆·奥尔特曼率领的OpenAI发起了一波嘲讽。


02

开源的“命运齿轮开始转动”


接下来,咱们进入正题。


咱们先从书名说起,大家可能都会好奇,一本讲技术文化的书,为啥会有“大教堂”和“集市”这两个词?到底是什么意思?


其实,作者是用“大教堂”和“集市”这两种形态,来代表两种不同的开发方式。“大教堂模式”就像是一个宏大的规划,先列好长远的目标和计划,可能是五年、十年的打算。然后,一小部分领导或资深专家来主导,下面一层层管理、协作,直到最后按部就班地完成某个任务,等到发布的那一刻,才一鸣惊人。


“集市模式”,你可以把它想成一个热闹的菜市场,里面有卖菜的、卖鱼的,也有买东西的、闲逛的。这里没有统一的领导,也没有明确的开发目标或盈利方向。大家在这里各自为营,杂乱无章,却依然保持着独特的生命力,充满了无限的可能和活力。


插个题外话,2024年4月17日,百度召开了他们的2024百度AI开发者大会,在大会上,创始人李彦宏除了发布他们的新模型之外,还谈起了开源模型,他说:“大家以前用开源,觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”然而,这还不到一年,DeepSeek就横空出世,随后百度也跟着宣布,将在未来几个月陆续推出文心大模型4.5系列,并于6月30日起正式开源。讲这个例子,我想说的是,百度特意选定了一个开源日期,提前几个月发布,把开源作为一件值得大肆宣传的事。这只能说明,在DeepSeek的浪潮下,百度并没有真正对开源下定决心,这可能只是一个防守策略而已。从理论上讲,这并不是开源精神。


那什么是开源精神呢?


开源,简单来说,就是一个技术人或者团队将自己的所有代码无私公开,全球的开发者都可以免费获取、学习,甚至修改和应用到自己的项目中。我之前提到过的GitHub就是全球最大的开源社区。


回到《大教堂与集市》这本书,作者埃里克·史蒂文·雷蒙德(通常称为ESR),他不仅是经验丰富的程序员,同时也是开源运动的旗手。



这本书的核心案例是开源操作系统Linux的故事。虽然大部分普通用户对微软的Windows系统或苹果的MacOS更为熟悉,但实际上,我们生活中用到的很多网站服务器、智能家电,甚至路由器的底层系统,都在使用Linux。而且,安卓手机的底层内核也是基于Linux的。所以说,事实上,我们几乎都是Linux的用户,只是很多人并不知情。


而Linux的背后,其实有一段非常有意义的故事。


1991年,一个名叫李纳斯·托瓦兹的芬兰大学生,在课余时间用自己的家用电脑,想体验一下类似早期大型机上才有的UNIX操作系统,于是他开始重新编写内核。


乍一看,这只是个大学生的玩票项目。但他并没有止步于此。他把自己写的源代码上传到了互联网社区上,并且邀请其他程序员一起来改改看。


用一句特别俗套的烂梗,那就是“命运的齿轮开始转动”。这件事,成了开源运动的重要里程碑。随着越来越多的程序员参与其中,大家一起修复Bug、改进代码,Linux逐渐变得越来越强大。因为每个人都可以看到源代码、修改代码,并将自己的修改贡献回来。随着时间的推移,Linux社区从最初的一个“学生项目”成长为全球最活跃、最成熟的开源操作系统之一。


03

开源,让我印象深刻的三大底层逻辑


当然,除了讲述Linux的故事,这本书还深入探讨了开源的核心理念,并详细解释了为什么开源运动能够取得成功,其中有三条底层逻辑让我印象深刻:


1.好的软件品,往往源自开发者的个人需要


在开源世界里,无论是项目的发起者,还是遍布全球、不计报酬地提交Bug反馈、修复代码的贡献者,很多人参与的动力其实都很简单,就是因为他们自己需要这个工具。


要知道,现实中有大量程序员对自己开发的软件并没有太多热情,他们只是把编程当作一份糊口的工作,每个月拿着不菲的薪水,完成任务就好。但在开源社区,情况完全不同。很多程序员大神,哪怕已经身家千万,依然会无偿更新和维护一些开源项目。因为他们真正喜欢、真正在乎这个东西,这就是“兴趣使然”的最佳例子。


2.早发布,常发布,倾听用户的反馈


在开源项目的开发模式中,尽早发布和频繁发布是至关重要的。刚开始时,许多成熟的开发者习惯性地认为,软件的早期版本往往会有很多问题。如果提前发布给用户,用户可能会因为体验不佳而流失。


因此,传统的开发模式通常是“大教堂式”的。它们集结精英、集中开发,经过六到八个月的测试,最终才推出一个稳定版本。


而Linux的创新就在于快速发布,最初阶段,甚至一天会发布多次更新。这样,许多早期测试者和项目贡献者能够迅速发现问题并进行修复。


正因如此,Linux的发起人Linus曾提出一句很有趣的话:“只要眼睛多,Bug容易捉。”


在“大教堂”开发模式下,Bug通常藏得很深,难以发现。需要经过多人、几个月的投入和检查,才能揭示出来。


但在集市模式下,如果上千个开发者都在热衷地研究每个新发布的版本,每个人都在不同的设备上运行该系统,那么问题就能被更快发现。而且,发现Bug的人为了自己的使用需求,通常会顺手修复它。


 

3.免费开源软件,不是因为道德高尚


这本书的作者还强调,千万不要把开源的技术人员或团队当作“利他者”,去夸赞他们的高尚品格。他指出,好的开源项目发起人其实也从中收获了很多,比如圈子里的影响力,或者帮助解决技术难题的人。这与闭源项目一样,只是一种开发选择,并不意味着开源项目比闭源项目更高尚。


当然,作者这样说,显得有些谦虚。在分享自己的开源项目时,他提到,如果你真心承认自己欠了别人很多,你就会发现整个开源社区会认为你是这个软件的发明者,并且在项目运行过程中,收到大量赞美邮件,这些正向反馈会不断涌来。来自全球各地的人会告诉你,你的项目如何帮助了他们。同时,当你采纳了其他人的测试报告或修改的代码时,给予每个贡献者的正反馈也非常强烈。


所以,我相信,DeepSeek这次愿意在下周将他们的代码仓库和工作细节公开出来,一定是因为在过去一个月里,他们收到了大量正向反馈,这激励他们作为开源社区的一员,愿意将自己的每一步探索都贡献出来。


那么,就像当初的芬兰大学生李纳斯·托瓦兹推动“开源”的命运齿轮开始转动一样。你有没有想过,DeepSeek这波操作,又会给全世界带来怎样的影响?会不会新的齿轮已经开始悄然转动?


我认为,一切才刚刚开始。


04

DeepSeek掀起的海啸才刚刚开始


在具体聊DeepSeek开源之前,我想先插播一个题外话。


2024年12月,一部挪威制作的灾难剧集《逃离火山岛》在奈飞上线,讲的是虚构的拉帕尔马岛火山喷发的故事。最开始,山顶的裂缝冒出白烟,裂缝越来越大,最终火山爆发。但奇怪的是,火山爆发并不是整个灾难的高潮。火山灰带着岩石滑入海中,最初就像泥石流一样。但随着波浪不断传递,最后竟然变成了滔天巨浪,席卷邻近的岛屿。


我为啥要说这个评分不高的小众剧集呢?因为当时看到火山爆发的时候,我以为那就是最大的灾难,完全没想到后面竟然会有海啸。现在回头看,DeepSeek的情况其实也差不多,目前的进展就像火山爆发,而真正对各行各业带来的巨大冲击,才刚刚开始。


就比如下周DeepSeek要开源他们所有的代码库,这件事对我来说,比之前开源的R1模型更有价值。


为什么呢?很简单,R1只是他们内部训练的成果,拿出来让大家用,你可以在R1的基础上开发自己的产品,这本身就很厉害。但现在,他们不仅仅开源了成果,更是把每天的工作细节都放出来。这意味着什么?如果他们的训练方法行不通,全球的团队可以立马调整方向;如果方法有效,其他团队会立刻受到启发,推动更大的创新。这就体现了“早发布,常发布”的精神,而DeepSeek做得更极致,他们直接每天都开源代码,持续推进创新。


去年年底,我们还在说,这个AI领域一直没有出现杀手级应用,现在DeepSeek就是第一个杀手级应用了。


在我看来,DeepSeek掀起的海啸主要有以下两波大浪。


第一波,是对普通用户来说,个性化体验将大幅提升。


现在,很多独立开发者或普通用户,都能基于DeepSeek的模型,做很多以前根本无法实现的任务。就像之前开源的AI图像模型Stable Diffusion(我们通常简称SD),它在2022年8月发布后,几个月内就衍生出了各种插画生成应用。而且,更牛的是,在GitHub开源平台上,和SD相关的项目疯长到1000多个。这意味着一个开源项目的成功,激发了更多开源项目的诞生。


还有很多普通用户,过去根本没接触过AI工具,但现在可以用DeepSeek来写文案、找资料,极大提升了工作效率。正因为用的人多了,未来会衍生出更多基于AI的产品,专门解决个性化需求,这才是真正的技术普惠。


第二波影响,是对企业来说,尤其是中小企业,AI应用的门槛大大降低,未来会渗透进各个场景。


过去,企业要做一个内部系统,通常得层层外包、招投标。如果要做一个AI应用,那就更麻烦了,人才、技术、资源等方面的限制都很大。但现在,DeepSeek的开源让很多企业里有想法的个人,经过研究后,可以非常快速地搭建出自己的企业应用。


而且,像R1这么强大的开源大模型,对于所有非AI企业来说,底层的模型已经不再是瓶颈,也不会是核心竞争力了,因为大家都可以拥有。这意味着,企业的关注点会转向自己的核心数据、行业独特的洞察力、或者AI场景的落地能力,只有这些才能成为新的竞争优势。


别说百度、腾讯、阿里这些大厂,或者我们这些原本就有软件研发能力的团队快速拥抱DeepSeek,就连我家保险门上的智能锁品牌,前天晚上也发了一篇公众号,宣布他们家的智能锁接入了DeepSeek。


那一刻,我有点恍惚。作为一个产品经理,我开始遐想:如果智能锁接入了思考推理模型,到底能做些什么?是我站在门口时,它根据心情来决定是否开门?还是它安装在某个渣男家门口,发现有小三来访时,AI自动通知女主人?


当然,这只是开玩笑,但至少说明一点,企业接入AI已经不再是难事。


回到DeepSeek,他们这波成功的核心,实际上就是开源。


开源R1模型,让全球开发者都能把它下载到电脑上,动手一试,惊讶地发现这个模型真的是“能打”。


不仅如此,DeepSeek还开源了R1模型的论文和报告,吸引了一批技术大神前来关注,解读他们在强化学习等方面的独到之处。正是这些技术突破,让硅谷的科技圈开始平视DeepSeek,平视中国的AI产品。


再说到DeepSeek的R1模型回答中的思维链,第一个具备推理能力的AI模型是OpenAI的o1,虽然它能推理,但OpenAI并没有将思考过程展示出来,认为这不是重点。而DeepSeek则大胆地将自己的思考过程用文字一一展示出来。对我来说,这个过程的展现,比最终的输出结果更触动人心。


而接下来,DeepSeek又要开源自己的代码仓库,让全世界的开发者看到,他们团队每天都在做什么。


他们发布的那段话,简直就像是一篇开源世界的宣言。最后一句,简直点亮了整个话题:“这里没有象牙塔,只有纯粹的车库精神和社区驱动的创新。”


我把这句话发给DeepSeek,想让它为我的这篇文章写个结尾。它说:“大教堂的壁画终将斑驳,而集市的账本永远鲜活。”

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

和创始人交个朋友

回到顶部

 

加载中...

扫码咨询