AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!
发布日期:2024-04-17 14:50:39 浏览次数: 1783


继之前公开课之后(周鸿祎:2024 年 AI 产业发展的 16 个趋势。)红衣大叔兑现诺言,开源了 7B 系列大模型。

面对同质化严重的各类大模型,大家可能有些审美疲劳了。但是,360 新开源的这个可不太一般

这一次 360 总共开源了四个模型,分别是基础模型,和4K,32K,360K 上下文的模型?

其中基础模型采用 3.4 万亿 Tokens 的高质量语料库训练,以中文、英文、代码为主。

通过对比国内外同参数模型,360Zhinao-7B 综合平均分达到前三,在C-Eval、MMLU、HellaSwag、LAMBADA 上达到第一,也就是说,模型在中英文知识和理解推理能力上具备较强竞争力。

听起来这么厉害,实际能力呢?是骡子是马,拉出来遛遛。我们在魔搭(国产版 Huggingface,大模型托管平台)上简单部署测试下这个 7B 的模型,并挑战一下富含人类智慧精华的“弱智吧”问题集。

怕新来的朋友不知道弱智吧是什么,弱智吧就是百度贴吧里比较火的一个小组,里面的一些提问看似弱智,其实充满了双关语,以及深刻的逻辑和各种各样的梗。

我们先来测测双关语,看看模型的思维能力?

第一回合:大家都说我嘴很甜,他们什么时候尝的?

此“嘴甜”非彼“嘴甜",回答正确。
第二回合:孙子是怎么提前两千年预判战斗机的发明的还提出了“战机很重要”“不要失去战机”这种理论的?


此“战机”非彼“战机”,没想到 360 这都答对了,有点东西。
第三回合:弱碱是碱,那么弱智是智吗?
“弱智”是指智力水平较低的人,“弱智”非“智”,回答正确。
好家伙,全对,咱们再来点棘手的逻辑题,测测模型的哲学思辨能力?
第四回合:为什么近视的是眼睛,看不清的是未来?
一个有点扎心的问题...但是没想到 360 竟然还懂幽默。
第五回合:完美的人会不会因为缺少缺点而变得不完美?


不知道谁想出来的这提问,我一个智力正常的成年人都不知道该怎么一本正经的回复,360 你可以的。
第六回合:为什么等红灯是在等绿灯?
“如果您在等红灯,您是在等待绿灯出现”,妙啊。
回答都正确,直接“出院”,“弱智吧”这么睿智的提问都能回答的甚好,至于其它关于常识、数学、编程等问题,应该都不在话下,家人们可以亲自去体验一番。
除了睿智的基础能力,360 的对话模型也开放 4K、32K、360K 三种不同文本长度。据了解,360K(约50万字)是当前国产开源模型文本长度最长的
(笑死,大叔也是会营销的,模型里也要埋个 360 的彩蛋
模型的“上下文长度”是什么意思呢?一个形象的比喻,就相当于大模型的视野,这个是非常重要的。上下文长度越长,大模型在回答问题的时候,能看到的内容越多越全面,回答的也就越准确。
隔壁长文本一哥 Kimi,内测的 200 万字长文本功能,给群友都“钓成翘嘴”了,也没看几个人申请到。
反观红衣大叔的格局还是很大的,一开源就开源个国内最长的。
然后 360K 的这个模型,也在中英文大海捞针测试中,都能达到 98% 以上的准确率
大海捞针是个很有意思的测试,简单来说,可以被看作是在浩瀚的文本(比作“大海”)中巧妙地嵌入一个无关的片段内容(称为“针”),接着通过提出自然语言的问题,检验人工智能是否能够精确地识别并提取出这个特定的词语。
英文原版 360k 大海捞针效果,取得了 98.27% 的高分。


360 仿照 SuperCLUE-200K 测评基准,也构造了中文版的大海捞针。中文,也取得了 98.24% 的高分。
然后我们喂了《三体》第一部和二部的数据,测试下长文本能力,也是非常快速的给到了正确的答案。
问题:四位面壁者和他们的破壁人分别是谁?
回答:四位面壁者分别是弗里德里克·泰勒、曼努尔·雷迪亚兹、比尔·希恩斯和罗辑。他们的破壁人分别是弗雷德里克·泰勒的破壁人是泰勒自己,曼努尔·雷迪亚兹的破壁人是墨子,比尔·希恩斯的破壁人是亚里士多德,罗辑的破壁人是自己。
问题:庄颜最喜欢的画里写了什么字?
回答:庄颜最喜欢的画里写的是“亲爱的,我们在末日等你。”
好家伙,老板让我写的调研报告,这下也有着落了。
至于为什么能这么牛逼呢,原来啊,360 技术实现上抛弃滑动窗口 attention、跳跃 attetion 等有损压缩路线,采用的是超长文本的无损压缩技术


超长文本无损压缩最大的挑战在于随着序列长度的增长,模型训练的复杂度平方增长,而据悉,此次 360 智脑在训练长文本模型时采用了两阶段的方式进行:
这种两阶段训练的方式,有效解决了长文本模型在训练长度和训练效率上的问题,实现了高效的长文本拓展方法。
总的来说,360 新开源的 7B 大模型是非常优秀的,包括微调训练代码,推理代码等全套工具集,开箱即用,在 7B 这个参数量级上,也算是“遥遥领先”了!
BTW,听说 360 自己把这个开源模型跟网红 AI 浏览器打包,马上要推出端侧版。断网也能用,而且千元显卡就能跑起来,创业者福音~



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询