支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI驱动下软件市场的4块蛋糕

发布日期:2025-03-26 12:51:05 浏览次数: 1569 来源:IT大实话
推荐语

AI技术正重塑软件市场的格局,四大领域将面临颠覆性变革。

核心内容:
1. 软件需求将分化为四大市场领域
2. 大模型AI的“幻觉”问题及其对软件编码的影响
3. 容错性需求与非容错性需求对软件开发的影响

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
随着大模型ai coding能力越来越好,软件市场将会发生剧烈的变化。我的思考是:将来软件需求会分化为如下4块蛋糕。
  • 小B市场,有容错的软件需求。
  • 小B市场,非容错的软件需求。
  • 中大B,不需要高度抽象设计的普通软件需求。
  • 中大B,需要高度抽象设计的专业软件需求。
下面解释为什么这么划分,以及这些市场将会被谁吃掉。
大模型存在幻觉且短期内不可能被消除
众所周知,大语言模型其实是个神经网络的概率模型,其本质上是一个巨大的矩阵行列式计算。这种海量参数(百亿、千亿甚至万亿个参数)的矩阵计算,所表达的是一种知识的“压缩”,而并不是知识的“精确存储”。在这种背景下,大模型的AI能力,几乎是不可能消除“幻觉”的。
关于“大模型不可能消除幻觉”这个结论,下面就是我亲手测试的一个例证:
    问:999999994646x99999568758等于多少。
    下面分别是DeepSeek、通义千问、豆包给出的答案:
    很明显可以看出:这3个大模型都在“一本正经的胡说八道”,答案都是错的!正确的答案是:99999568222602308869668。如果你有兴趣,可以用python,写如下一行脚本就能出来答案:
    本质上来看,这种基于概率计算基础上的大语言模型,是无法彻底消除“幻觉”的。如果要彻底消除这种“幻觉”,只能依赖于神经网络底层算法架构的创新。而这种创新的时间周期,一般以十年以上为单位,少则10多年、多则几十年。可以肯定地说,大模型幻觉问题,在“短期内”是无法消除的。
    无法100%消除“幻觉”的问题,就导致使用大模型写出来的软件代码,无法做到100%准确。这就涉及到要软件需求本身的容错性问题。
    软件需求的容错性与否,决定了人类程序员是否退场
    人们对软件的功能需求,其实是可以区分为容错和非容错两种的。
    容错性需求,指的是那些软件反馈的结果不稳定、有偏差、但对实际结果几乎无影响的功能需求。典型的如:自动生成演讲稿、自动编故事、自动画PPT,甚至包括根据数据生成分析图表等等。这一类的需求,并没有标准答案,人们也并不指望IT系统给出一个确定性的答案,而只要软件系统给出的反馈,在某个可接受的“模糊区间”内,都是可接受的。就以统计图表为例,假设要生成某企业最近12个月的销售额变化趋势,其实人们需要的并不要求那个曲线上每个点的绝对坐标值正确,而只要那个曲线展示出来的变化趋势正确即可。
    而非容错性需求,指的就是那种“绝对不允许出错”的情况。比如:软件根据销售团队的业绩贡献,计算销售人员的绩效提成;或者,需要系统支持某个业务流程,在A角色完成业务操作后,自动判断后续B角色需要执行什么业务操作。这一类的需求,是绝对不允许软件有哪怕一点点偏差的。甚至,在医疗、能源、交通等领域,这种一点点的偏差,可能会涉及到人身安全问题。
    很容易就能得出这样的结论:对于有容错性的软件需求,完全可以交给大模型来自动生成软件代码,而几乎不用人类程序员的参与软件代码的纠错——也就是人类程序员可以退场;而非容错性的需求,就一定需要富有经验的人类程序员来对代码进行纠错(即:DEBUG)过程,才有可能最终让代码执行正确无误的业务逻辑。
    所谓软件行业的市场蛋糕,本质上是由“人类程序员”这个角色处于产业链的哪个位置来决定的。知道了哪些场景下人类程序员可以安全退场,就可以进一步结合企业对“人类程序员”这一角色的组织能力,来判断软件产业链的蛋糕划分了。
    在人类程序员无法退场的领域,AI会提升开发效率5~10倍以上
    前面已经说到,对于“非容错性软件需求”的开发,人类程序员是无法完全退场的。
    但是,即使在这样的软件开发领域,AI也会使得“软件开发”这一生产过程,效率得到极大的提升。在敏捷软件开发过程中,主要的工作量,可分为“需求与设计、代码编程、测试修错”3大阶段(还有一个部署发布,但现在的部署发布一般都是自动化的,人工工作量可以忽略不计)。根据实际统计数据,其中代码编程、测试修错一般认为会占80%以上的工作量。
    关于“需求与设计”环节,其实这个部分的工作,除了特大型软件系统,大多数软件系统的开发过程中,并不一定需要由外部的软件厂商来提供服务,可能反而企业客户自身更适合做这件事。因为真正的业务知识是掌握在企业客户内部的,作为外部软件厂商,反而要向客户“学习”这部分知识。
    所以,真正评估AI给“软件开发”这一生产过程带来的效率提升,应该主要关注“代码编程、测试修错”这两部分。
    拿最近的大模型评测数据来看,其中代码编程部分,80%以上的工作量已经可以被大模型取代;而测试修错部分,其实有70%以上的工作量,是程序员在编写代码做自动化测试代码。另据统计,“代码编程”与“测试修错”的工作量占比,目前是3:2的关系,也就是60%在代码编程、40%在测试修错。
    这样一来,在当前的大模型技术水平下,AI能够替代“人类程序员”的工作量,就有 (60% + 40%*70%) *80% = 70%的比例。这实际上,就是让“人类程序员”的工作效率提升了3倍以上。
    这还只是当前大模型发展水平下,可以不夸张的说,随着大模型的发展,预计2~3年内,人类程序员的工作效率可以提升5倍、甚至10倍以上。
    企业客户的组织能力和软件抽象能力,决定了市场蛋糕划分
    在大模型加持下,对于企业客户来说,要满足自身的软件应用需求,无非就是三种方式:AI自动生成软件、自己开发软件、对外采购软件。
    显然,对于那种“容错性”软件,是可以直接用第一种方式来满足需求的。而对于“非容错性”软件,只能要么自己开发、要么对外采购。我们分别来看。
    首先,对于“容错性”软件来说,很自然的就需要通过“软件开发AI平台”来完成。企业客户要决策的问题就变成了:这个“软件开发AI平台”从哪里来?
    关于软件开发AI平台”的来源,因为技术难度高、投资风险大、而又可以跨行业使用,无论对于大B还是小B来说,其都完全没有必要自己开发建设,而由专业的平台来提供。目前市面上,既有类似字节coze这样的AI应用开发平台,也有类似devin这样的“AI程序员”创业项目,还有宜搭、简道云、明道云等这些零代码或低代码平台。
    其次,对于“非容错性”软件来说,到底是自己开发、还是对外采购,完全取决于企业自身的投资水平和组织能力,很显然小B和大B是不同的。
    对于小B来说,其组织规模一般在百人以下,甚至只有10~20人。在这样的组织里,哪怕“人类程序员”效率提升了10倍以上,但即使只招聘一个月成本2万(按工资、社保、办公费用等)以上的程序员,显然是不现实也是没必要的。
    而对于大B来说,其组织规模一般几百人、甚至千人万人,既然“人类程序员”效率提升了10倍,那就可以通过招聘很少的程序员(很可能是个位数),来实现之前由一个庞大程序员团队才能完成的软件开发工作。也就是说,大B不需要对外采购专业软件公司的服务了。
    但是,问题就是这么简单吗?其实不是,软件还有个“抽象设计”水平的问题。好的软件,不仅仅是满足某个大B客户的个性化业务流程的,还会根据多个同行业不同大B客户的业务流程进行“抽象归纳”,将“最佳业务实践”固化到软件设计中。很多大B购买某个软件,更多的不是看重该软件有多少功能,而是因为需要引入该软件所内置的某个“最佳业务实践”。
    很显然,这部分“软件抽象设计”的工作不是AI大模型目前能够满足的。而且,在可预见的未来,这部分能力大模型也很难具备。所以,这部分工作,是需要由专业的软件公司才能胜任的。
    当然,并不是说,所有的“非容错性”软件,都需要很高的“抽象设计”水平。事实上,80%以上的软件,是不需要进行“抽象设计”的——只满足当前的简单需求就好,根本不用考虑引入“行业最佳实践”这种东西。
    总结起来看,软件需求的满足,将分为下图所示的4块蛋糕:
    上图中,白底蓝字的,就不是软件市场,而是企业客户自我满足;而绿底白底的,才是软件市场之所在。分别解释如下:
    • 软件开发AI平台。这部分市场,大概率是诸如字节coze、宜搭+通义灵码等这些互联网大厂平台的机会。
    • 为小B提供“非容错性”软件的服务公司。这是软件市场的机会,而且大厂一般看不上,所以是小创业公司的机会。
    • 为大B提供专业的软件产品。这部分软件市场,典型的如SAP、Salesforce等,需要理解特定行业的多客户know how,进行高水平的软件抽象设计后,才能在软件中内置“行业最佳实践”,从而为大B提供额外的价值增量。


    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询