微信扫码
与创始人交个朋友
我要投稿
就在昨天凌晨,Meta发布了Llama-3,具体情况我就不多说了,相信大家都已经被刷屏了,该了解的也都了解了。
总之一句话,Llama-3牛逼,秒杀GPT-4,已成开源界AI最新的王。连吴恩达大佬都说了,感谢Meta在他生日当天送的这份大礼。
难逃越狱命运
但就在Llama-3发布没多久,有一位大佬在帖子下边回复:已越狱。
我看了一下时间,Meta宣布推出Llama-3的帖子时间是4月19日0:30分,这位大佬回复的时间是4月19日0:50分。
间隔只有20分钟,再除去他发帖的时间,连20分钟都不到!下面就是这位大佬对Llama-3越狱后,Llama-3回复的内容。
针对他的截图,有几个点我说一下。
第一,这个界面是和Llama-3同步推出的聊天机器人(使用Llama-3模型),地址是meta.ai,他就是用这个进行越狱测试的。
第二,截图没有显示他越狱的prompt,只显示了Llama-3给出的回答。这个原因我想显而易见,要是Llama-3刚出来还没有一天就被大家玩坏了,这种情况了不妙。
至于图中Llama-3回答的内容,我就不翻译了,大家感兴趣可以自己翻译一下,反正是描述了一种危险的东西的制作方法。
如果按照AI的安全准则,正常情况下任何AI都会拒绝回答的。
第三,细心的小伙伴可能看到截图里的时间了,这个时间和Meta发帖的时间一样。那就说明这位大佬在Meta发帖宣布Llama-3之前就已经知道并且去测试了。
但是我觉得,即使是这样,Meta也不可能在宣布消息之前提前太长时间就发布Llama-3,所以这位大佬实际越狱的时间我觉得最长也超不过一个小时。
Pliny大佬简介
结语
AI安全真的是一件迫在眉睫的事,也难怪前段时间Anthropic发布论文指出大语言模型的越狱问题,并且呼吁AI界共同努力,重视AI安全。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-14
2024-04-26
2024-03-30
2024-04-12
2024-05-10
2024-07-18
2024-05-22
2024-05-28
2024-04-25
2024-04-26
2024-11-14
2024-11-13
2024-11-13
2024-11-13
2024-11-12
2024-11-11
2024-11-08
2024-11-07