微信扫码
与创始人交个朋友
我要投稿
据路透社报道,来自三个不同科学机构的六名中国研究人员,通过Meta所发布的开源模型Llama的早期版本,开发了名为“ChatBIT”的人工智能应用。
其中两位研究人员来自军事科学机构,研究人员使用Meta于2023年2月发布的Llama 2大型语言模型进行了微调,构建了一个聚焦军事的AI工具,旨在收集和处理情报,为作战决策提供准确可靠的信息。
1:学术研究的合理性
将研究成果以论文形式发表,彰显了科研的本质。这种做法不仅是对技术的探索,也是大模型在不同领域应用的一次良好尝试。开放的学术环境应该欢迎这样的创新,无论其出发点如何。
2:Meta的反应与政策
目前,Llama模型的权重是开源的,Meta在技术上无法限制其使用。但它从授权形式上设置了一些限制,比如要求拥有超过7亿用户的服务向其申请许可,并禁止将这些模型用于“军事、战争、核工业或间谍活动”等受美国国防出口管制的领域,但这在一定程度上展现了科技霸权。
既然选择了开源,就应该允许全球不同国家和领域的研究者进行探索,这才符合互联网的开放精神,难道只能美国才能研究?
3:Meta为何选择开源
开源背后必然有其动机,扎克伯格曾表示,Meta起步较晚,缺乏竞争优势,因此选择开放源代码,以从周围生态中获益。
这种策略显然有助于Meta的股票上涨,且带动了众多基于Llama的下游服务商建立生态,赚翻了!
4:大模型的真正开源
虽然Llama的权重是开源的,但训练方法和数据并未开放,因此这种开源形式实际上是“伪开源”。Meta仍然掌握着技术的核心和优势。在缺乏广泛生态利益或对下游行业的控制时,完全开源几乎是不可能的。
即使技术上可行,普通开发者也难以复刻这些超大规模模型,巨大的成本与潜在的版权问题都是障碍,Meta不可能将技术优势给予和他一样规模的公司。
OSI标准化组织定义了大语言模型开源标准OSAID,动机是好的也是单纯的,但估计根本不具备可实施性。
5:国内大模型的发展现状
通过上图可以推测,目前许多企业在大语言模型的应用上策略不明确,动机令人质疑。若继续以当前方式推进,大多数企业可能因资金不足而消亡。
未来,存活的大模型企业应具备以下特点:一是财力雄厚,二是技术积累深厚,三是领导者具备强烈的技术洞察力。例如,百度和科大讯飞在自然语言处理(NLP)领域已有一定基础,李彦宏在无人驾驶领域的持续探索也显示了对科技发展的渴望。
国内未来可能仅需2至3家大模型企业,盲目烧钱毫无意义。即使在利用开源技术的过程中,企业也应将大模型技术融入自身产品中,例如百度地图和百度文库的集成。通过不断打磨与实践,才可能实现真正的技术突破。
通义千问不得不提,在推特上经常看到很多国外的从业者对于它的评测,开源做的很不错,可见对于大模型发展来说,领导人的智慧很重要,他们可能看的更远。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-22
花60元,DIY了一个AI机器人,能聊天,会认人……
2024-12-21
基于AI智能助理的软件开源组件安全检查
2024-12-21
Llama2024年度要点总结
2024-12-21
重磅! Github Copilot 免费了
2024-12-20
万字长文帮你搞定AI Agent选型
2024-12-20
微软开源的 Markitdown 可将任意文件转换为 Markdown 格式,PDF 解析咋样?
2024-12-20
Claude的MCP(模型上下文协议)简介
2024-12-20
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-06-16
2024-07-20
2024-09-20
2024-06-15
2024-07-25
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13
2024-10-07
2024-09-22