AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


LLaMA3非常好啊!!!
发布日期:2024-04-25 15:15:54 浏览次数: 1742 来源:阿泽的学习笔记


LLaMA3真的是相当相当炸裂啊!远超过去的体验!看数据Llama3-8B超过Mistra-7B MMLU 10分;70B超过Claude3 Sonet 3分。

在线体验地址:https://www.llama2.ai/

再更新一个体验地址:https://chat.lmsys.org/?leaderboard 选【Direct Chat】

这是一个惊人的成绩,一个开源模型超过闭源模型这样多。我只能说Meta是真正的OpenAI。自从它从Meta这个邪路上转正后,在OpenAI的路上一骑绝尘了!

这里的核心我能想象是Yann LeCun的坚定的支持,同时也真的是这个我非常喜欢的Zuckerberg的钱吧!

那么在LLama3的架构上,有什么变化呢?

我想影响最大的是训练数据,现在有一个共识了吧,一个优质的数据是能让小模型的性能超过大模型的,而一个15T的数据肯定是要超过2T数据的,这次的LLama3是用了15T Token训练的啊,而做为全球最大的SNS网站,我想它的数据只有寥寥几家能比吧:Google、Tencent、ByteDance!还有谁?



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询