AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Llama3.3
发布日期:2025-02-06 13:45:24 浏览次数: 1526 来源:观其形明其意
推荐语

Meta最新发布的Llama 3.3模型,以更少的参数实现媲美更大模型的性能,提供高效、低成本的AI文本解决方案。

核心内容:
1. Llama 3.3模型参数及性能对比
2. 多语言支持及架构优化
3. 安全措施:Llama Guard 3、Prompt Guard、Code Shield

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

  Meta于20241206发布了Llama 3.3,共有 700 亿参数(70B),性能方面媲美拥有4050亿参数的Llama 3.1的效果。多项测试效果及表现接近GPT-4o

目标:

  • Llama 3.3 模型效率更高、成本更低,可以在标准工作站上运行,降低运营成本的同时,提供高质量文本 AI 解决方案。

  • Llama 3.3 模型重点优化了多语言支持,支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语 8 种语言。


模型:

  在架构方面,Llama 3.3 是一款自回归(auto-regressive)语言模型,使用优化的transformer decoder架构,其微调版本使用了监督式微调(SFT)和基于人类反馈的强化学习(RLHF),让其与人类对有用性和安全性的偏好保持一致。

  安全方面,Meta 采用数据过滤、模型微调和系统级安全防护等措施,以降低模型滥用的风险;此外 Meta 鼓励开发者在部署 Llama 3.3 时采取必要的安全措施,例如:

  • Llama Guard 3:

  • 功能:监控和过滤输入输出,防止生成有害或不适当的内容。

  • 作用:确保模型输出符合安全和道德标准。

  • Prompt Guard:

  • 功能:检测并阻止恶意或不当的输入提示。

  • 作用:防止用户通过特定提示诱导模型生成有害内容。

  • Code Shield:

  • 功能:防止模型生成恶意代码或执行不安全操作。

  • 作用:确保生成的代码安全,避免被用于攻击或漏洞利用。


  • 训练数据量:15万亿(T,Trillion)公开数据

  • 知识截止日期:2023.12

    • 训练开销:3930w GPU小时(H100-80G)


      Llama 3.3采用了全新的对齐过程(New Alignment Process)和改进的在线强化学习(online RL)技术,使之在70B参数的情况下达到与Llama 3.1 405B相当的性能水平。

    • 全新的对齐过程(New Alignment Process):确保模型输出与人类意图和价值观一致,提升安全性和可控性。

    • 对齐(Alignment):指让模型的行为与人类意图、价值观或特定目标保持一致的过程。

    • 优化点:

    • 更精细的指令微调:通过更高质量的人类反馈数据(如人类偏好数据)对模型进行微调,使其输出更符合人类期望。

    • 多目标优化:同时优化多个目标(如准确性、安全性、公平性),而不仅仅是单一的性能指标。

    • 动态对齐:在模型部署后持续监控和调整,确保其行为始终符合预期。

    • 作用:提升模型的有用性、安全性和可控性,减少有害或不符合预期的输出。

    • 改进的在线强化学习(Online Reinforcement Learning, Online RL):通过实时用户反馈优化模型,使其在部署后持续改进,同时保持高性能。

    • 强化学习(Reinforcement Learning, RL):一种机器学习方法,模型通过与环境交互,根据奖励信号优化行为。

    • 在线强化学习(Online RL):在模型部署后,实时从用户交互中学习并改进。

    • 优化点:

    • 实时反馈:通过用户交互数据(如点赞、纠正、反馈)动态调整模型,使其输出更符合用户需求。

    • 高效学习:采用更高效的算法,减少对大量数据的依赖,同时避免模型性能下降。

    • 安全约束:在强化学习过程中加入安全约束,防止模型学习到有害行为。

    • 作用:使模型能够持续改进,适应多样化的用户需求,同时保持高性能和安全性。


     总之,Llama 3.3在参数更少的情况下达到与更大模型相当的性能,同时更具安全性和适应性。

    参考:

    https://github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md

    https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct

    https://ai.meta.com/blog/future-of-ai-built-with-llama/

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    与创始人交个朋友

    回到顶部

     
    扫码咨询