微信扫码
与创始人交个朋友
我要投稿
总的来说,中国的AI大模型还是处于跟随状态。然而,随着像 OpenAI 这样的公司推动人工智能技术的应用,许多前沿技术已经进入了实用阶段。这为中国带来了机遇,因为中国在应用层面上具有独特的优势。
先上结论。
美国对开源大模型的控制很难完封锁住中国,反而会提升中国在美国开源市场的影响力 ;
中国大模型之争正在集中化,但市场还未形成,竞争已经白热化,短期盈利前景渺茫 ;
基于大模型的AI应用开发的⻔槛进一步降低,一方面会出现大量特权开发者,一方面小团队开发的终端应用会出现爆炸性增⻓,其中会孕育未来的巨无霸;
现在大家核心关注的问题是中国的大模型是否面临内忧外患。外患方面,美国两党一致延续对中国的封锁策略,试图限制开源大模型,认为中国在人工智能应用上领先对美国构成威胁。美国不希望中国利用其技术来对抗自身,特别是开源使中国能够免费使用这些技术,这让美国感到不安。因此,美国试图加强管控,但实际上很难控制开源大模型的发展。
内忧方面,中国的大模型市场已经开始价格战。一个典型例子是,5月21日百度宣布两款大模型免费开放:Speed 和 Lite,这两个相对轻量的大模型免费提供,而最强大的大模型依然收费。尽管如此,价格战的开启并不是一个好兆头。
首先,讨论中国大模型是否会被封锁。美国的背景是,5月8日美国两党合作推出了《加强海外关键出口国家框架法案》(ENFORCE Act),其中部分内容涉及出口管制,特别是限制大模型技术向中国和俄罗斯的转移。美国的担忧不仅限于俄罗斯,还包括伊朗、北朝鲜等国家。其主要担忧是,大模型技术,如 AlphaFold 3,可以模拟所有蛋白质,这可能加速生物武器的开发。
美国已经采取了多项措施:
扩大总统的管制权:有权管制特定AI系统和对国家安全重要的技术。
增加企业义务:企业若与国外公司合作输出大模型,需获得美国商务部的许可,类似于软件出口许可。在国内销售无碍,但出口需单独许可。
模型管制标准:当前标准关注模型的参数数量,例如百亿级还是千亿级参数。
人才管制:讨论是否限制持有 H1B 签证的中国员工或留学生从事AI/ML相关工作。若法案通过,这些人可能需要单独许可。
这些措施主要涉及就业和技术限制。然而,实施起来相当困难,原因有以下几点:
数量庞大:需要监控和许可的对象数量巨大,增加了政府的工作量。
行政效率低下:美国政府的行政效率相对较低,经常面临资金短缺和关门问题。如果需要定期更新许可,这将增加政府的持续工作量。
科技使用效率低:美国政府的科技使用效率不高,增加了管理的复杂性。
美国的这些限制措施在实际操作中面临诸多挑战和不确定性。
从上图可以看出中国在人工智能人才培养上的比例分布情况。图表显示,中国人工智能人才的本科比例非常高,但硕士和博士比例逐渐下降,就业比例更低。原因很简单,大量人才出国深造和工作。比如,最近有传言称微软的人工智能研究团队人员可以迁往美国。如果他们选择留在中国,团队将解散,但如果愿意搬到美国,微软会协助办理所有签证手续。这意味着,中国培养了大量本科人才,但到了硕士、博士阶段,许多人选择出国,最终就业也在国外。因此,美国的39.52%人工智能人才实际上是来自中国。如果这些人才被严格管控,将是一个巨大挑战。
技术限制方面存在两大难点。首先,仅靠参数数量来限制大模型已经不再有效。现代大模型往往是多专家模型的混合,参数数量不再是唯一指标。此外,剪枝技术的应用使得模型在参数减少的情况下性能保持不变。其次,如果模型参数不够高就不限制出口,而参数达到一定级别才限制,这需要企业提供所有的技术后台文件。为了提交审查,企业需要公开模型的详细技术资料,这可能导致竞争对手有机会学习和借鉴,从而带来商业风险。例如,美国企业之间常通过诉讼来获取对手的技术细节,这样的操作在模型审查中也可能发生。
产业方面,限制开源也面临困境。限制开源生态的主要路径有两条。源头限制Meta & 谷歌的开源模型,会抑制AI市场竞争;底层限制开源生态的分发过程,太弱无法起到限制作用,太强会抑制产业创新。如果禁止开源,人工智能的竞争将受限。开源的目的是通过社群化的方式集合众人之力对抗闭源。限制开源可能会抑制产业创新。另一个问题是,中国和美国的研发水平不同,美国的限制已经晚了。比如,GPT-3.5的出现意味着技术已经突破,美国才开始讨论限制,但中国已经获取了开源模型。因此,技术革命的传播速度快于立法监管的速度,导致监管失效。
美国仍旧是从0-1技术探索的前沿阵地,中国企业更关注工程优化&商业落地
5月21日,Anthropic公布AI可解释性新研究成果,运用【字典学习】技术,将AI参数激活状态转化为更容易理解的特征,成功提取AI模型中的数百万个特征
这些特征包括具体的事物(如城市旧金山、科学家罗莎林德.富兰克林)以及抽象的概念(如代码中的错误、性别偏见的讨论),实验中通过提高【金门大桥】特征权重,可以引导AI在回答中频繁出现金门大桥这一概念。
这种动态调整输出的能力背后涉及一个叫“AI概念地图”的概念。AI概念地图,类似于人类的领域智能,通过建立坐标系来参考和预测各种可能性。这种模型可以在视觉、地理等多维度上形成参考系,从而合理预期未来的情况。Jeff Hawkins 提出的“记忆-参考-预测”结构化模型就说明了这一点。
美国在这方面的研究突出,而中国则擅长性能调优。例如,李开复创办的零一万物在全球AI性能排行榜上排名第六,这展示了中国在工程上的优势。然而,全球排名并不能完全说明问题,尤其是中文语料训练在中国的独特需求。
中美研发处于不同层面,美国专注于技术探索,而中国则在性能调优上具有优势。
未来十年,中美在人工智能上的竞争可能更多集中在第三国市场。比如,谷歌在马来西亚投资建立云计算中心,中国也可能在其他国家建立类似的设施。各国希望在本国建立数据中心,以保证数据安全,这将成为中美竞争的新焦点。
中国无法通过现有的大模型实现超越,但美国也不能完全封锁中国获取基础模型。因此,中国可以继续专注于应用开发,并利用自身优势在全球市场中占据一席之地。
针对美国限制开源大模型的措施,傅盛傅老板的核心观点是开源是技术生态的重要部分,培育出了Linux、ARM等新技术平台和企业,限制开源生态就是让出一个重要的技术阵地。
如果美国不进行开源,而中国继续推进开源,号召更多人一起合作,从而享受更大的好处。这也是美国的尴尬之处:限制中国实际上也是在限制自身产业的发展。当然,美国限制开源大模型意味着其衰弱的开始,这个观点可能有些夸张,美国仍然具有领先优势。
有人可能会问傅盛的机器人是否有可能依靠大模型进行突破。现在还看不到这种可能性。目前他的机器人主要用于搬运,侧重于运输能力,这方面大模型的作用有限。真正需要大模型训练的是机械手,而傅盛的机器人没有机械手。所以,虽然他在上一轮机器人小爆发中介入了,但现在看来布局有点早,市场还未爆发。云迹在抢占酒店服务市场方面表现较好,而猎户星空则显得有些尴尬。因此,猎户星空的机器人短期内可能难以崛起。
所谓的“百模大战”很快就结束了,这次热潮持续的时间非常短。2022年11月ChatGPT推出后,激发了中国市场的热情。2023年2月,王慧文投入5000万元创立大模型创业项目,掀起了一阵小高潮。然而,由于心理原因,他很快决定不再创业。王兴则接手了他的创业团队,将其并入美团,等于帮他善后。
2023年6月,百模大战正式打响,但不到一年时间就偃旗息鼓。2023年9月,中国号称有244款国产大模型,但到12月,持续更新的模型减少到156款。到了2024年5月,仅剩下19款。许多大模型如流星般昙花一现,迅速消失。
不仅百模大战降温,价格战也开始了。这反映了科技创新的速度越来越快。
OpenAI 的 GPT 系列可能会成为大模型中的“苹果系统”,而 Llama 则会成为“安卓系统”。目前看来,这种趋势正在形成,尽管还有一些竞争。因此,现在关注头部企业是关键。大模型之所以需要关注头部企业,是因为其他企业玩不起。大厂如腾讯、阿里、百度有足够的资源。阿里通义系列大模型依靠开源生态逐渐获得开发圈认可,官方财报透露AI云服务实现三位数增长,参考微软AI云计算带来15亿美元左右营收,预估阿里云的AI收入目前仅在百万量级;腾讯混元大模型主要向腾讯会议等APP提供AI助手等增值服务,此前主要是自用;华为的使用者较少,尽管他们喊了很久的创新生态,合作生态建设还是比较弱;字节跳动的大模型未来前景看好。
除了大厂,还有一些豪华团队,如王小川的百川智能、智谱清华的唐杰教授团队等。这些团队资金充足,可以短期内不盈利,但这种模式也存在风险。即使目前有十几个团队,最终还是会有很多无法存活,因为市场需求尚未完全起来,差异化不足导致很多企业难以为继。
有人说,华为的大模型似乎与其芯片绑定,如果属实,这违反了产业常识。人工智能可以分层,芯片不应影响软件。强行将芯片与软件、大模型绑定,不利于生态发展。
未来,软件将定义一切(software define everything),包括人工智能。因此,将人工智能与芯片捆绑在一起的策略是不明智的。
真正有可能走通的还是头部大厂。大模型未来可能会像云计算一样,成为一种基础功能。除非是像 OpenAI 一样具备特别的创新能力,否则难以在市场上占据一席之地。大厂如阿里和百度,不仅提供云计算服务,还顺便推出自己的人工智能模型。他们不会允许其他第三方在自己的平台上搭建基于开源模型的套壳模型。因此,形成像 OpenAI 和微软那样的合作关系在国内是很难的。
字节跳动是典型的大厂优势案例。它为了满足自身需求进行研发,同时对第三方开放,但核心技术仍掌握在自己手中。字节跳动有自己的云平台“火山引擎”,基于该平台推出了大模型“豆包”,并在其上开发了一系列应用,如AI应用开发平台“扣子”、互动娱乐应用’猫箱‘,以及星绘、即梦等AI创作工具,并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务,用以提升效率和优化产品体验。
QuestMobile的数据,截至3月底,豆包月活用户已达2328.2万,成为当前AI助手应用领跑者。
大厂进行人工智能研发的主要目的是提升自身竞争力,改善应用的用户体验。通过自用实现节能增效,字节跳动不仅提升了自身平台的效率,还能在达到一定程度后对外开放服务,比如,MiniMax等大模型企业采用火山引擎云服务。这类似于亚马逊云的模式。亚马逊最初也是为了自用,提升平台效率,随后对外开放,发展成了云业务。
这种模式确保了大厂在人工智能领域的竞争力,因为它们能够在内部节能增效提高效率,进而向外提供服务。
李开复创立的零一万物阶段性技术领先,5月13日周年大会宣布将推动商业化
如果是创业公司,独立开发一个大模型会显得非常尴尬。以零一万物为例,尽管它在国际上排名第六,但在中国的影响力有限。在国外排名第六的产品很难获得用户青睐,技术优势不明显。更令人尴尬的是,前段时间被曝出零一万物的大模型实际上是Llama的套壳版,只是简单修改了变量名,基本没有其他改动。
零一万物现在也在尝试下沉,走应用的商业路径,比如PDF阅读、PPT生成等。然而,这些应用市场很小众。此外,他们的AI角色扮演面向海外市场,但却基于GPT-3.5,而不是自家的大模型。这进一步质疑了其大模型的实际性能。
他们试图通过理论上的Product-Market Fit(产品与市场的契合)来解释自己的策略,现在更强调Technology and Cost-PMF(技术与成本的契合)。尽管这种市场理论看似有道理,但与大模型的实际开发和应用并无直接关联。因此,这种说法有些尴尬。
这种情况暴露了一个问题:零一万物在国内是套壳国外的大模型,在国外则直接使用别人的模型,并套上应用壳。这个做法虽然不违法,但有违商业伦理,因此引发了争议。然而,由于目前大家对大模型的重视程度不高,这种争论也不是特别激烈。此外,套壳现象在行业内很普遍,只是零一万物被揭露了而已。
关键问题在于应用场景和市场定位。如果你的技术在国内相对最强,但在全球并非顶尖,那么在全球市场需求不足,而在国内又没有专门针对中国市场进行优化和调教,这样就会陷入一个尴尬的境地。即便你在国际上有一定排名,但由于使用的是Llama2等开源模型,优势也会被削弱。
另一个值得关注的是清华计算机系唐杰教授领导的智谱项目。智谱平台基于唐杰教授多年的研究,公司成立于2019年,但研究工作早在2017、2018年甚至更早就开始了。那时,社交网络创业热潮正起,尤其是基于微博的数据开放性,催生了许多创业项目。唐杰教授当时开发了Aminer,一个论文数据挖掘平台,利用的是知识图谱技术和社会化计算(social computing)算法。
唐杰教授早期的研究和商业关注为今天的智谱奠定了基础。智谱不仅仅是一个套壳大模型,更是将原有的知识图谱技术与现代人工智能技术相结合,形成了自己的特色。今年1月推出GLM-4大模型,优化了自回归机制,模型列入全球榜单。虽然特色不够鲜明,但在学术研究搜索等领域具有一定优势。
DeepSeek-V2模型性能受到国外关注,完全开源模式得到研发圈认可
另一个值得关注的团队是幻方量化(DC),它成立于2015年,最初并不专注于人工智能,而是致力于量化策略。幻方量化在量化支持领域对技术进展非常了解,并持续跟踪最新技术。公司最初为基金公司提供量化支持,帮助基金快速成长:2019年达到百亿规模,2021年则增长到千亿规模,两年间实现了十倍增长。
2019年,幻方量化投资了两个亿,开发了大模型平台“萤火一号”,并配置了1100块GPU。到2021年,他们进一步看到机会,投入10个亿开发“萤火二号”,搭载了1万张英伟达A100显卡,成为中国拥有最多英伟达显卡的企业之一。
幻方量化的背景很有趣,它原本是为证券公司提供技术支持的。随着技术不断迭代,他们逐渐将技术支持转变为基于人工智能和大模型的技术支持。大模型技术成熟后,他们将其分离出来,形成一个独立的大模型团队,就是深度求索,不仅支持证券业务,还支持其他业务。
今年5月,深度求索发布了DeepSeek-V2模型,该模型由160个专家模型组成,采用了新的注意力机制,大幅减低模型训练与推理成本,按照8个H800 GPU组成的计算单元成本计算,降价后峰值运行下毛利也能达到70%以上。能够同时跟踪多个目标,类似于特斯拉的自动驾驶技术。客户普遍认为,深度求索的编程和数学能力是国内最好的,这使得他们在to B领域具有很强的竞争力。
幻方量化与前面提到的两类企业有所不同:一类是大厂,另一类是由牛人创业并吸引大量投资的公司。幻方量化则类似大厂,因为它基于证券公司的技术投入,具有很强的研发能力和资金支持。
国产大模型就这几类,它们的两个主要特征:价格战和对齐税。
虽然市场尚未成熟,但大模型领域的价格战已经开始。这很好理解,各家公司都在争夺市场份额,通过降低价格来吸引客户。
有初创开发者反馈,大部分降价都是匆忙上线,像豆包的API调整起来非常棘手,花了几天才接入进去,他们现在还在进行优化。至于qwen-long的官方文档,问题也不少,实际用下来效果并不尽如人意。
降价集中第二梯队模型,第一梯队模型降幅有限
对比可以看出,全球AI性能排行上榜模型仍然列为最贵模型之列,大模型价格战有利于更多开发者尝试国内模型。
对齐税是指为了使大模型适应本地特点,需要进行本地化调优,确保模型不会输出愚蠢或违背伦理的答案。这种人为限制会导致模型的整体性能下降。性能和人为干预呈反比关系:人为干预越少,性能越好,但如果干预少,模型可能会犯严重错误。尤其在中国,这种错误可能会带来严重后果,因此对齐税显得尤为重要。
大模型的价格战背后的尴尬之一是需求不足。截至5月29日,不完全统计全球公开融资的AI创业企业共1057家,中国仅72家,其中大模型企业kimi & MiniMax位列全球第一、第三,国内大模型下游仍在培育阶段。尽管市场竞争激烈,但实际需求却不够强劲。此外,出海也是一大挑战。像零一万物这样的公司在欧美市场很难竞争,因为本土的顶级大模型已经占据了市场。然而,在一些第三国市场,如马来西亚,中国的大模型可能会有更多的机会。如果世界前五的大模型公司不进入这些市场,那么排名靠后的中国公司就会有竞争优势。
赤子城的全球化策略非常值得借鉴。赤子城的创始人是北邮毕业的,他选择在东南亚市场创业,开发了类似微信和淘宝的应用,取得了巨大的成功,最终被腾讯收购。这种模式表明,第三国市场可能成为中国大模型的重要出口地。中国的大模型如果能够在这些国家实现本地化,成为当地的民族之光,就像中国的电动车一样,可以为这些国家带来新的技术机会。
4月共有349款生成式AI产品获得牌照,发放范围进一步扩大
当前,监管对牌照的管控有所放松,但仍然存在很大的风险。大厂在这方面相对好一些,因为它们已经被监管多年,积累了一定的经验。例如,DeepSeek 正在等待审核列表的稳定,以便将 API 服务器切换过去。但如果审核列表不稳定,切换可能导致系统失灵。因此,最好的选择是通义千问,它具备专门的风险控制机制,可以智能地撤回信息或结束对话,提供更好的开发体验。未来的智能内容审核需要做得非常好,而背后其实有很多人为因素在起作用。
关于腾讯的生态在AI时代的应用层面是否更有价值,目前尚不确定。腾讯对自身的用户行为有深入理解,这对内部应用可能很有价值。但如果将这些数据应用于开发,则可能泄露用户信息。此外,是否能开放给第三方使用也是一个问题,因为这涉及到数据的保密性。
百度在AI领域的多年投入面临挑战。并不是百度的技术被开源,而是其他公司的开源技术使百度失去了领先优势。百度目前的主要收入来源于搜索业务,但搜索正成为被攻击的重点目标。未来两年,搜索领域将发生巨大变化,这对百度不利。每一次市场和产业格局的变化,百度作为头部企业都会面临损失,而其他创业企业可能会从中获利。因此,百度的前景与谷歌类似,面临尴尬的处境。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-08-13
2024-04-11
2024-07-09
2024-07-18
2024-10-25
2024-07-01
2024-06-16