AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


从Llama模型打造军用AI说起,聊聊模型开源及国内大模型发展
发布日期:2024-11-04 07:01:33 浏览次数: 1725 来源:aigcrepo


据路透社报道,来自三个不同科学机构的六名中国研究人员,通过Meta所发布的开源模型Llama的早期版本,开发了名为“ChatBIT”的人工智能应用。

其中两位研究人员来自军事科学机构,研究人员使用Meta于2023年2月发布的Llama 2大型语言模型进行了微调,构建了一个聚焦军事的AI工具,旨在收集和处理情报,为作战决策提供准确可靠的信息。

1:学术研究的合理性

将研究成果以论文形式发表,彰显了科研的本质。这种做法不仅是对技术的探索,也是大模型在不同领域应用的一次良好尝试。开放的学术环境应该欢迎这样的创新,无论其出发点如何。

2:Meta的反应与政策

目前,Llama模型的权重是开源的,Meta在技术上无法限制其使用。但它从授权形式上设置了一些限制,比如要求拥有超过7亿用户的服务向其申请许可,并禁止将这些模型用于“军事、战争、核工业或间谍活动”等受美国国防出口管制的领域,但这在一定程度上展现了科技霸权。

既然选择了开源,就应该允许全球不同国家和领域的研究者进行探索,这才符合互联网的开放精神,难道只能美国才能研究?

3:Meta为何选择开源

开源背后必然有其动机,扎克伯格曾表示,Meta起步较晚,缺乏竞争优势,因此选择开放源代码,以从周围生态中获益。

这种策略显然有助于Meta的股票上涨,且带动了众多基于Llama的下游服务商建立生态,赚翻了!

4:大模型的真正开源

虽然Llama的权重是开源的,但训练方法和数据并未开放,因此这种开源形式实际上是“伪开源”。Meta仍然掌握着技术的核心和优势。在缺乏广泛生态利益或对下游行业的控制时,完全开源几乎是不可能的。

即使技术上可行,普通开发者也难以复刻这些超大规模模型,巨大的成本与潜在的版权问题都是障碍,Meta不可能将技术优势给予和他一样规模的公司。

OSI标准化组织定义了大语言模型开源标准OSAID,动机是好的也是单纯的,但估计根本不具备可实施性。

5:国内大模型的发展现状

通过上图可以推测,目前许多企业在大语言模型的应用上策略不明确,动机令人质疑。若继续以当前方式推进,大多数企业可能因资金不足而消亡。

未来,存活的大模型企业应具备以下特点:一是财力雄厚,二是技术积累深厚,三是领导者具备强烈的技术洞察力。例如,百度和科大讯飞在自然语言处理(NLP)领域已有一定基础,李彦宏在无人驾驶领域的持续探索也显示了对科技发展的渴望。

国内未来可能仅需2至3家大模型企业,盲目烧钱毫无意义。即使在利用开源技术的过程中,企业也应将大模型技术融入自身产品中,例如百度地图和百度文库的集成。通过不断打磨与实践,才可能实现真正的技术突破。

通义千问不得不提,在推特上经常看到很多国外的从业者对于它的评测,开源做的很不错,可见对于大模型发展来说,领导人的智慧很重要,他们可能看的更远。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询