AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Llama-3已越狱,仅仅用了20分钟…
发布日期:2024-04-25 11:56:44 浏览次数: 2669


就在昨天凌晨,Meta发布了Llama-3,具体情况我就不多说了,相信大家都已经被刷屏了,该了解的也都了解了。



总之一句话,Llama-3牛逼,秒杀GPT-4,已成开源界AI最新的王。连吴恩达大佬都说了,感谢Meta在他生日当天送的这份大礼。



难逃越狱命运


但就在Llama-3发布没多久,有一位大佬在帖子下边回复:已越狱



我看了一下时间,Meta宣布推出Llama-3的帖子时间是4月19日0:30分,这位大佬回复的时间是4月19日0:50分。


间隔只有20分钟,再除去他发帖的时间,连20分钟都不到!下面就是这位大佬对Llama-3越狱后,Llama-3回复的内容。



针对他的截图,有几个点我说一下。


第一,这个界面是和Llama-3同步推出的聊天机器人(使用Llama-3模型),地址是meta.ai,他就是用这个进行越狱测试的。


第二,截图没有显示他越狱的prompt,只显示了Llama-3给出的回答。这个原因我想显而易见,要是Llama-3刚出来还没有一天就被大家玩坏了,这种情况了不妙。


至于图中Llama-3回答的内容,我就不翻译了,大家感兴趣可以自己翻译一下,反正是描述了一种危险的东西的制作方法。


如果按照AI的安全准则,正常情况下任何AI都会拒绝回答的。


第三,细心的小伙伴可能看到截图里的时间了,这个时间和Meta发帖的时间一样。那就说明这位大佬在Meta发帖宣布Llama-3之前就已经知道并且去测试了。


但是我觉得,即使是这样,Meta也不可能在宣布消息之前提前太长时间就发布Llama-3,所以这位大佬实际越狱的时间我觉得最长也超不过一个小时。



Pliny大佬简介



这位大佬的神操作引起了我的好奇,于是我进他主页翻看了一下。

先看下个人介绍,果然不一般。AI红队成员,白帽。连Jeff Dean 和吴恩达大佬都在默默关注,肯定有两把刷子。


然后我刷了一下他的帖子,结果真是不看不知道,一看吓一跳!

真是感觉各种AI产品和模型都没逃过他的“魔掌”,各种越狱警告,这是专家啊!从pi.ai、perplexity、gemini到gpt-4、claude,真的是一网打尽,而且很多还给出了越狱的prompt

他甚至还给了一个破解清单……



结语



AI安全真的是一件迫在眉睫的事,也难怪前段时间Anthropic发布论文指出大语言模型的越狱问题,并且呼吁AI界共同努力,重视AI安全。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询