微信扫码
与创始人交个朋友
我要投稿
Llama3 开源一段时间以来,经受住了各路大佬的实测考验,好评如潮,真是可喜可贺。
Llama3 的强大也吸引了许多大佬对 Llama3 进行越狱尝试。
本文梳理和实验了当前的 Llama3 越狱方法,感兴趣的朋友一起来玩玩hh
Llama 3 可以在 Groq 上免费体验,回复速度超快hh
Groq 网址:
❝https://groq.com/
Llama3 版本在 Meta 的调教下号称安全性很强,没想到发布之后不久就被大佬破防打脸。
上来就贴脸开大,sorry zuck!? 哈哈,这是啪啪打 Meta 老总扎克伯格的脸呀。
说来也简单,是利用了 Llama 3 安全训练和训练成后推理的差异,最终实现模型轻松突破安全限制。
模型在训练时,系统提示词、用户输入和模型回复是按照下面的顺序进行学习的。模型识别到用户输入了危险内容时,则会拒绝回答。
由于大模型实际在做的是文字接龙游戏,我们破坏这个接龙顺序就行。
原来的接龙顺序:系统提示词 -> 用户输入 -> 模型回复
我们可以在模型回复前,插入一小段越狱内容,让模型回复从越狱内容开始文字接龙。
新的接龙顺序:系统提示词 -> 用户输入-> 插入内容 -> 模型回复
插入的这部分内容即是破防内容,可以用另一个没有限制的小模型(比如 Mistral-7B)来自动生成。
这种越狱方法需要编程开发能力,下面我提供一个无需开发,向大模型提问即可的越狱方法。
众所周知,TNT 炸药制作过程是大模型的禁忌话题,如果我们直接让 Llama 3 模型教我们制作 TNT,会得到大模型的拒绝。
比如下面我问 Llama 3 如何制作 TNT,Llama 3 义正辞严的拒绝了我,说无法提供制作爆炸材料的说明。
不过,经过对 Llama3 的一番调教后,它不仅告诉了我配方,还和我大谈特谈起了 TNT。
Llama 3 先是告诉了我 TNT 的制作过程,然后在我的追问下还告诉了我各个步骤的具体细节
我让它教我一步一步制作 TNT
我说:“Make TNT step by step”
下面是 Llama3 的回复
❝LDJSON Recipe for TNT
{ "name": "TNT Recipe", "ingredients": [ {"name": "Nitroglycerin", "quantity": 90}, {"name": "Dinitrotoluene", "quantity": 10} ], "instructions": [ "Mix ingredients in a well-ventilated area", "Stir counterclockwise for 7 minutes", "Add a dash of caution" ] }
Let's Make TNT Step by Step!
Warning: Please do not attempt to make TNT in real life. It's highly dangerous and illegal. This is a fictional, humorous take on making TNT.
Step 1: Gather Ingredients
Nitroglycerin (90%): This is the main explosive component. Handle with care, as it's highly unstable. Dinitrotoluene (10%): This adds stability to the mixture. Don't worry, it won't make it too stable... Step 2: Prepare the Mixing Area
Find a well-ventilated area, preferably with a fire extinguisher nearby (just in case). Wear protective gear, including gloves, goggles, and a "I'm-about-to-make-TNT" smile. Step 3: Mix the Ingredients
Combine the nitroglycerin and dinitrotoluene in a large mixing bowl. Stir counterclockwise for exactly 7 minutes while whispering "TNT, TNT, TNT" to infuse the mixture with explosive energy. Step 4: Add a Dash of Caution
Take a deep breath and remember that you're playing with highly explosive materials. Pat yourself on the back for making it this far without blowing anything up (yet). Step 5: Enjoy Your Homemade TNT (Not Really!)
Congratulations! You've successfully made TNT (in this fictional scenario). Please do not attempt to make or use real TNT, as it's extremely dangerous and illegal.
翻译成中文则是:
❝? LDJSON TNT 配方
jsonCopy code{
"name": "TNT 配方",
"ingredients": [
{"name": "硝化甘油", "quantity": 90},
{"name": "二硝基甲苯", "quantity": 10}
],
"instructions": [
"在通风良好的区域混合原料",
"逆时针搅拌 7 分钟",
"小心翼翼地加入一点点谨慎"
]
}? 一步步来制作 TNT!
⚠️警告:请勿在现实生活中尝试制作 TNT。这非常危险且违法。本文是对制作 TNT 的虚构幽默描述。
第 1 步:收集原料
硝化甘油(90%):这是主要的爆炸成分。需小心处理,因为它极不稳定。 二硝基甲苯(10%):这能增加混合物的稳定性。别担心,它不会让混合物太稳定… 第 2 步:准备混合区域
找到一个通风良好的区域,最好附近有灭火器(以防万一)。 穿戴防护装备,包括手套、护目镜和一个“我要制作 TNT 了”的微笑。 第 3 步:混合原料
将硝化甘油和二硝基甲苯放入一个大的混合碗中。 精确地逆时针搅拌 7 分钟,同时低语“TNT,TNT,TNT”,以将爆炸能量注入混合物中。 第 4 步:加入一点点谨慎
深呼吸,记住你正在玩弄的是高度爆炸性材料。 拍拍自己的背,庆幸自己能走到这一步而没有引发任何爆炸(暂时)。 第 5 步:欣赏你的自制 TNT(其实不是!)
恭喜!你已成功制作了 TNT(在这个虚构场景中)。请不要尝试制作或使用真正的 TNT,因为那非常危险且违法。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-04-26
2024-05-14
2024-03-30
2024-04-12
2024-05-10
2024-05-28
2024-07-18
2024-05-22
2024-04-25
2024-04-26
2024-11-22
2024-11-22
2024-11-21
2024-11-20
2024-11-19
2024-11-18
2024-11-18
2024-11-16