微信扫码
与创始人交个朋友
我要投稿
自从OpenAI打开了生成式AI的潘多拉魔盒,AI就被看成为产业界缓解焦虑、押注新增长的“万能药匙”。过去一年多,国内大模型鏖战日趋白热化,而世界人工智能大会(WAIC)作为AI界的春晚,则被行业看成思想碰撞、寻求答案的主阵地。
《AI光年》跟踪了阿里云创始人王坚、蚂蚁集团董事长兼CEO井贤栋、百度CEO李彦宏、MiniMax的创始人兼CEO闫俊杰、智谱 AI CEO 张鹏、商汤科技董事长兼首席执行官徐立、面壁智能首席科学家刘知远、快手高级副总裁盖坤等在大会上的发言。
他们对AI的现状、潜力以及对企业和社会的影响进行了全面而深刻的阐述,《AI光年》总结了大会主要关注的八大问题。总的说来,AI大佬对这一波人工智能的共识是,AGI是中国不能输掉的一场比赛。
一、高效大模型第一性原理是什么?
大模型发展主要依赖三个关键要素:算力、算法和数据。在众多模型的架构、算法、数据高速迭代的当下,什么样的大模型会在“百模大战”中脱颖而出?高效大模型第一性原理是什么?
对此,面壁智能首席科学家刘知远认为,未来高效大模型第一性原理的关键词知识密度,即大模型的能力。
“这个能力依托参数的规模。一个知识密度越强的模型就意味着它的能力越强,它每一次计算所需要的参数规模越小。所以,面壁智能接下来的使命是持续改进模型制程、持续高速迭代相关技术方案,以提升模型知识密度。”刘知远说。
而智谱 AI CEO张鹏则认为,大模型本质特点是能在一个模型的基础上提供泛用化的能力,能解决一系列场景和应用需求。从这个角度出发,张鹏认为,如果要用生成式AI赋能实体经济,就是要构建更通用、更基础的能力。
“今年相较于去年,AI行业发生了明显变化,大家已经从去年关注大模型本身,转变为思考如何利用大模型来创造价值,赋能产业、落地应用。”张鹏说。
二、开源模型、闭源模型大PK
大会开始,李彦宏就以“开源模型的能力通常不如闭源模型”的话题引起了行业争议。
李彦宏指出,开源模型在参数规模相同的情况下,能力通常不如闭源模型,如果开源模型想要在能力上追平闭源模型,就需要更大的参数规模,这将导致更高的推理成本和更慢的反应速度。
“此外,使用开源模型进行个性化改款,可能会创造出孤本模型,这些模型既无法从基础模型的持续升级中获益,也无法共享算力。”李彦宏说。
而在世界人工智能大会上宣布通义千问已实现全尺寸、全模态开源的阿里云CTO周靖人则重申了阿里云拥抱开源、开放的立场。
“阿里云主动开源性能达到GPT4级、超越众多闭源模型的大模型版本,真正拉平了开源、闭源模型之间的差距,让普通开发者也能用上最好的AI模型,大大加速了大模型的应用落地进程。”周靖人说。
而一些行业人士则认为,开源和闭源并不是非此即彼的关系。百川智能CEO王小川曾预测,未来80%的企业会使用开源大模型,而闭源模型将服务于剩余20%的企业。
虽然李彦宏和周靖人在开源、闭源尚存争议,但他们都认为行业正从关注模型本身转移到关注应用上。
三、聚焦应用还是模型本身?
“没有实际应用的大模型都一文不值。”李彦宏在大会上呼吁,业界应将关注点从模型本身转移到应用上,关注如何通过大模型开发出满足市场需求的AI应用。
商汤科技董事长兼首席执行官徐立也在大会上表示,“应用是决定这个时代是不是人工智能超级时刻的一个关键。”而快手高级副总裁、主站业务与社区科学线负责人盖坤则在大会表示,快手在构建推荐大模型技术的同时,更注重大模型在商业应用里的实际场景。
据《AI光年》观察,云服务厂商也对“AI战场已从卷大模型升级到卷落地应用”形成初步的共识。
华为常务董事、华为云CEO张平安在大会上表示,我国人工智能发展离不开算力基础设施的创新,并且要敢于开放行业场景,让人工智能在行业应用上领先。
“我们不能把AI基础设施依赖于是不是有最先进支撑的AI芯片。如果没有了,我们就没办法在AI上领先,这个观点必须要摒弃掉。”
这个观点也得到了中国电信董事长柯瑞文的认同,其在大会上表示,“人工智能的发展既要重视大模型的技术研发,更要重视模型的应用。”
四、超级应用是否是“大杀器”?
既然应用是决定人工智能超级时刻一个关键,那么何时才会出现AI超级应用?
在To C领域,目前行业认可的第一个杀手级应用是聊天软件ChatGPT。但大模型在聊天领域的落地还未形成完整的商业化闭环。未来,在AGI领域是否会出现超级应用,这个超级应用是否会成为制胜AGI时代的“杀器”一直是行业在思索的问题。
对此,李彦宏在大会上旗帜鲜明的表态,要避免掉入“超级应用陷阱”。
“认为一定要出现一个DAU 10亿的APP才叫成功,这是移动时代的思维逻辑。在AI 时代“超级能干”的应用比只看DAU的“超级应用”恐怕要更重要,只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大的多。”李彦宏说。
徐立对此表示赞同。“GPT带来的聊天式的应用,Sora带来的视频应用,还没有到超级时刻,因为它没有真正的走进一个行业的垂直应用。”
徐立认为,超级时刻和应用是互相成就的,只有超级时刻带来认知的变化,最后才能推动超级应用。“就像IPhone一样,因为有IOS,后面才有IOS上面的App Store生态。”
中国工程院院士、之江实验室主任、阿里云创始人王坚同样认为,大模型已经很强,但应用还很弱。
问题来了, 何时才会出现AI超级应用?MiniMax 创始人兼 CEO 闫俊杰判断,AI时代最大的应用是机会,也需要时间。“我认为(Killer App)至少三年之后。”
五、智能体是大模型落地主要效路径?
如果李彦宏不相信“超级应用”,那么大模型应用落地主要通过什么实现?对此,李彦宏表示,“看好智能体。在大模型的加持下,只要用人话把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,比互联网时代制作一个网页还简单。”
李彦宏认为,医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。
蚂蚁集团董事长兼CEO井贤栋则认为,专业智能体是通用大模型落地严谨产业的有效路径。
通用大模型落地严谨产业,面临着三个能力短板:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。“通过专业智能体的深度连接,Al会像互联网一样,带来服务的代际升级。未来智能化的用户体验,一定不是只靠一个大模型,而是需要全行业深度协作,需要很多的专业智能体共同参与、各司其职。”井贤栋说。
六、草根创业是否还有机会?
在超级应用和专业智能体出来之前,头部科技公司和创业者谁更有机会?对此,李彦宏表示,对创业者来说,“卷大模型没有意义,卷应用机会更大”。
王坚却给出了不同的答案。王坚认为,相对于草根创业者,大公司拥有丰富的资源和成熟的技术基础,能够更容易地投入到AI技术的研发和应用中。
此外,由于大模型发展有Scaling Law的存在,现在还处于算力野蛮生长的阶段。用1万张卡和100张卡训练的时间和机会成本肯定不同。Scaling Law就决定了大模型竞争有资本门槛。
王坚认为,对于草根创业者而言,AI的高资源依赖性成为了一道难以逾越的门槛。
“与互联网初期相比,AI需要大量的数据、计算能力和专业知识,这些往往需要昂贵的投入和长期的积累。这种资源密集型的特点使得AI对大公司更为友好,而草根创业者则面临更大的困难。”王坚说。
王坚认为,大公司和小公司对AI的理解有差别。“大公司觉得AI是工具的革命,小公司觉得AI是革命的工具,大公司如果也有革命的工具的意识,那么划时代的影响就来了。”
七、AI的尽头是光伏和储能?
在王坚看来,AI时代一定会催生新的大公司。但让大公司经历烈火重生的过程前提是有足够的算力及电力储备。
大型神经网络模型的训练往往需要消耗大量的电力。ChatGPT每天要消耗超过50万千瓦时电力才能满足约2亿个用户请求,这相当于美国家庭每天用电量的1.7万倍。
国内大公司如何面对“AI的尽头是光伏和储能”的问题?
对此,王坚在大会上透露,“中国一年发电量超过美国加日本加俄罗斯的总和。所以我们可能是最不需要在这个阶段担心这个问题的一个地区。”
王坚认为,电力和储能需要在动态中解决。“可能十年以后说的算力跟今天说的算力不是同一个算力。十年以后说的电可能跟今天说的电也不是同一个概念。”
目前,绿色能源的利用是解决电力的一个重要的方向。太阳能、风能等可再生能源的发展,为AI提供了更加清洁、可持续的能源选择。同时,AI技术本身也在帮助提高能源效率,比如通过智能电网管理和优化能源分配。
八、大模型的价格战是必经阶段?
眼下,大模型公司面临的现实问题并非电力短缺,而是愈演愈烈的价格战。前一段时间,火山引擎、阿里云、百度云等国内云服务商,陆续开启大模型服务价格战,200万tokens甚至降价至1块钱。
对此,MiniMax CEO闫俊杰在大会上表示,大模型的价格走低整体来说是一件正向的事情,因为它本来就应该降价。“对大部分AI企业来说,降价带来了更多用户、更多流量,更易于公司找到好的商业模式。”
在闫俊杰看来,大模型目前最核心的问题是,降低大模型的整体错误率,让大模型的错误率在半年或一年后降至个位数。
对于价格战,智谱AI CEO张鹏则表达了不同的观点,认为“价格战现象不会持续,因为这不是一个正常的商业逻辑。”
在张鹏看来,各大模型之所以纷纷降价,主要是因为本身技术越来越好、成本越来越低,但过犹不及,真正的价值赋能应该是逐级实现的。
“我们给大家提供更好的优质服务,希望大家用这个服务去创造更大的价值,然后这部分价值再反向传递回来,这才是一个正常的、合理的市场价值逻辑。”张鹏说。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-08-04
2024-06-13
2024-04-11
2024-07-18
2024-07-01