微信扫码
与创始人交个朋友
我要投稿
作者|赵健
2024年6月,零一万物CEO李开复博士在参加北京智源大会时谈及了大模型在B端产业的机会。李开复当时表示:“零一万物坚决做to C,不做赔钱的to B。”
半年过去,零一万物对待to B的态度也悄然发生一些变化。
今天,零一万物发布了两个全新的行业解决方案——面向电商直播的“如意”数字人解决方案,以及面向智算中心的AI Infra解决方案,正式进军to B市场。此前,零一万物在B端仅仅开放了API开放平台。从API到行业解决方案,零一万物在B端的投入越做越深。
中国的to B向来是个拥挤的赛道。虽然各家的打法各不相同,但有一个共同点是——大部分都集中在私有化定制项目,很难赚钱。近期某“AI四小龙”大裁员,就是一个例证。
此次零一万物加大对B端业务的投入力度,是否意味着零一万物已经在B端市场找到了能够赚钱的方法?
今年6月,红杉资本曾发出“AI的6000亿美元问题”的灵魂拷问。红杉资本提出,当前AI收入规模与AI投资规模完全不成正比,AI收入差不多有5000亿美元的缺口。
在Scaling Law的影响下,OpenAI、xAI、谷歌、Meta等巨头将大量的资本支出投入在了AI Infra上。受益最大的英伟达一度超越苹果成为全球市值最高的公司。
这是一个健康的生态吗?李开复认为这显然是不合理的。
李开复在知乎的一个问题下回答:如果梳理近代几波技术革命,从PC时代到移动互联网,只有当最终应用爆发取得更多的收入时,才能形成健康的良性循环——应用吸引用户(客户),推动基础设施改进,随后基础设施的改进支撑应用不断迭代,吸引更多用户(客户)加入。这个金字塔应该是“倒三角”。
而现在,大模型生态里过多的资金与利润被芯片层和AI Infra分走了,而应用层不论中外市场都还在持续地探索验证中。
云生态收入与AI生态收入对比,图片来源:Altimeter Capital
李开复认为,如今的生成式AI生态更像是单纯追求AGI ,真正能提高企业和个人生产力的应用层只是一个“副产品”。事实上,追求AGI理应与落地不矛盾,甚至应该是相辅相成的。从行业角度看,只有应用层的繁荣才能引导整个生态走向良性循环;从公司自身的角度来看,成功的应用能够带来稳定的经营现金流,成为支撑AGI探索的商业基础。
今天,海外大模型公司正在AI Infra层展开军备竞赛,国内公司受限于算力资源,如何与海外大模型展开竞争?
李开复认为,海外的大模型突破发明能力更强,然后用钱来买时间,用超级大的资源投入换取先发优势。而国内大模型更多靠勤奋努力与工程化能力来获得训练成本的下降。以零一万物为例,训练成本只有OpenAI的3%,推理价格只有OpenAI的40%,但性能却能做到全球前十名。而且,海外大模型很难进入国内市场,反而国内大模型有很多的出海机会。
大模型公司本身不仅要关注基座模型的性能,不仅要关注算力储备,更重要的是“Make AI Work”,让模型能力能够真正落地,形成to B/to C 应用,产生商业价值。
过去一年,行业更多在探索大模型在to C领域的价值,在不厌其烦地寻找AI时代的“Super App”。零一万物去年以及今年上半年的业务重心也在C端。去年9月开始,零一万物聚焦生产力、社交等赛道,在海外上线了多款产品,总用户接近千万。今年6月,零一万物在国内发布AI办公助手万知。
在B端,无论是国内市场还是海外市场,大模型的能力都没有释放出全面的潜能。
在国内,B端市场很容易做成亏钱的项目制,这是一个普遍存在的困境。国外的市场环境稍有不同,除了Cohere之外,几乎所有的大模型公司仅仅提供API服务,而不提供SFT微调服务以及行业解决方案。因此,零一万物在走访中东、欧美客户的时候就发现,国际市场上私有化定制模型的需求没有被很好的满足。
零一万物成立之初就同时布局模型、AI Infra、应用三个层面,也就是李开复多次强调的“三位一体”战略,这一战略与苹果公司“垂直整合”的策略类似。
垂直整合的优势就在于,基于模型、 AI Infra、应用等多方面的能力,零一万物无需等待其他环节准备就绪,就可以基于国际一流模型构建出优秀的应用,并且迅速推向市场。这种“多位一体”的垂直整合能力还会让应用速度更快、性能更优、成本更低。
在此战略下,零一万物选择先从海外市场验证to C、先从海外市场做to B的战略,并构建了一套从模型到应用完整的企业级解决方案。目前,零一万物大模型to B解决方案已经与多家世界500强企业客户展开合作,涉及能源、零售、游戏、电商、智算等多个领域。
零一万物此前发布了Yi大模型开放平台,向企业客户开放Yi API以及模型训练平台。这一次,零一万物发布了两个全新的行业解决方案。
第一个是“如意”数字人解决方案。基于以Yi Lightning模型为代表的Yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座。其中,角色大模型为零一万物“如意”数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。
与AI 1.0时代的数字人相比,“如意”数字人解决方案不仅在形象和声音上更为逼真,还具备了“AI大脑”,能够自主完成部分决策任务。比如,当数字人应用于直播间,可以与弹幕进行实时交互。
零一万物“如意”已经跑通了包含本地生活直播、AI 伴侣、IP 形象、办公会议、媒体营销等场景,已合作客户包括中国领先的餐饮公司百胜中国,创新型亲子家庭服务商孩子王、新型智能算力运营服务厂商图灵新智算、知名内容营销一站式服务商乐淘互娱、数字化营销服务商直客通等。
与“如意”数字人解决方案配套,零一万物还将推出营销短视频解决方案“万视”,目前正在与头部客户共同打磨。使用“万视”后,运营人员可通过极简流程,随时生成超低成本、高品质的营销视频视频,解决了传统真人短视频的成本和制作周期问题。
零一万物发布的第二个解决方案是AI Infra。
零一万物从Day 1开始便注重打造自身 AI Infra 能力,打造了一支世界一流的 AI Infra 团队。截至目前,这个团队具备万卡集群的设计、建设和运营经验,构建过10+个超级 IDC,成功训练过多个百亿和千亿参数模型。
通过Yi系列模型的生产训练实践,零一万物的AI Infra团队积累起了多项核心技术。比如,基于故障预测、检测与自动恢复等技术搭建了On-the-fly弹性伸缩和故障恢复系统。当某块GPU卡或某台GPU卡服务器出现故障时,能够快速发现并定位故障设备并进行在线处理,同时还能确保训练或推理过程不中断。在多项核心技术加持下,零一万物自身MFU(模型 FLOPs 利用率)远超行业平均水平,Goodput(有效训练时间比率)也达到了99%。
在此基础上,零一万物通过AI Infra解决方案协助政府及企业构建大模型算力与服务平台,助力大模型应用落地。
今年7月,零一万物与新型智能算力运营服务厂商图灵新智算签署战略合作协议,零一万物将帮助图灵新智算在“黄埔一号”打造全球领先的新一代智算中心,双方在整机密度优化、大模型私有化部署、算法优化、算电协同等六大技术领域展开深度合作。10月末双方合作进一步深入,共同挂牌成立了零一万物-图灵实验室,共同推动以“如意”数字人为代表的大模型应用落地。
中国to B向来是个拥挤的赛道,各家的打法各不相同,大部分to B项目都集中在私有化定制模型。定制化模型之所以不容易赚钱,是因为当产品与服务不够标准化的时候,就会变成按照人/天计算的商业模式。
零一万物联合创始人祁瑞峰表示:“AI 1.0时代下围棋的模型下不了象棋,做蛋白质解析的模型也做不了其他,因为模型没有泛化性。因此,每一个不同的场景都需要从底层的数据标注、训练、推理、产品、应用从头到尾重新干一遍,干着干着发现公司人数超过1000人了,甚至更多的能到四五千人,成本当然非常重。”
祁瑞峰认为解决这一问题的关键是回到业务本质,真正让大模型进入客户核心业务场景,形成一个标准化、可规模复制的应用产品。
从Day 1开始,零一万物就已经开始探索to B方向,积极寻找大模型在各个场景下的能力边界。一方面需要考虑模型能力,以模型的强泛化性避免AI 1.0时代非标化、定制重、交付重的商业模式;另一方面则是要考虑推理成本,能够帮助企业客户核算ROI,在不赔钱的前提下做规模增长,是模型能力在to B方向落地的基础。
“垂直精细化”与“标准化”是零一万物大模型to B解决方案中频繁出现的关键词。
一方面,零一万物帮助企业把行业数据提炼出来,搭建数据库,训练自己的专属模型;另一方面,基于各项模块化的能力协助企业结合自身场景产出对内、对外的应用。这是“垂直精细化”。
而“标准化”的产品形态、订阅制的商业模式就是伴随云计算时代开始的被企业服所推动的业务演进方向,大模型的出现一定程度上解决了这一难题。零一万物的to B产品矩阵中,“如意”数字人解决方案的“万店直播”架构、Yi大模型开放平台都是以跨行业复用为目标。尽管是to B业务,但两条业务线都具备“高度可复制、规模化发展”的特点。
李开复表示,后续零一万物将采取“一横一纵”的打法,持续与客户深度探索“垂直精细化”新场景,并结合行业和应用场景凝练出“标准化”企业级应用,致力于将世界第一梯队的大模型能力转化为标准化云服务产品,在为客户带来业务价值的同时,跑通 AI 2.0 时代特有的可复制增长的商业模式。
(封面图来源:零一万物)
END.
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-07-20
2024-07-18
2024-07-16
2024-07-25
2024-07-14
2024-07-24
2024-08-13
2024-06-22
2024-08-06
2024-07-21