我要投稿

智谱，闷声不响发了个「100w 长文本模型」

发布日期：2024-08-14 20:20:55 浏览次数： 2369 作者：特工宇宙

最近各家模型发的都挺勤，一会一个 SOTA，一会一个遥遥领先。

可能有不少朋友有点「审美疲劳」，但我还是乐在其中的。

加上不是赶上了「价格战」嘛，我就经常去各家开发平台逛逛。

一是为了研究下定价，二是想测试下各种模型能力，是不是像宣传的那么 NB.

这不，前几天「智谱」不是搞了个 DemoDay，看到好多家公司都用智谱的大模型，所以就来智谱 AI 开放平台（bigmodel.cn）上看看，智谱的模型现在到底搞的咋样了。

结果不看不知道，一看就发现了大的。

智谱 AI 开放平台上，竟然悄无声息的发了个长文本模型，还是 100 万 Token 上下文长度的那种。

什么概念？现在主流的模型基本上都在 128k 这个量级上。根据 36 氪 6 月的一期报道，“1M token 的上下文窗口，意味模型能同时处理 200 万字的输入，大概相当于 2 本红楼梦或者 125 篇论文的长度”。

能同时处理 200 万字的输入？好家伙，这不小 Kimi 嘛。

OpenAI：好好好这么玩是吧，让你对标没让你超越啊。

不得不说，Kimi 的用户心智打的特别好，说到「长」，大家第一时间就会想到 Kimi.

但又有多少人，真正体验到了 Kimi 的 200 万字上下文的模型？

是不是都还在排队中？像我这样被通过的可谓是「凤毛菱角」。

反观智谱，既不发期货，也不饥饿营销，直接低调上线。属于是人狠话不多。

诶不过，你说有没有一种可能，没有大范围宣发，是因为还不太稳定，能力还不太强，但刚好被咱们特工抓包了呢？

简单，「GLM-4-Long」开放了 API，咱们来测试一下。

按照惯例直接开始整活！前段时间刚刚举行了一个全球算命师大赛，听起来有点离谱，但是人家已经办了 15 届了。

我们先找来一大堆相关书籍资料，提取其中的文字，用上下文而非 RAG 知识库外挂的方式，直接喂进去。

可以看到这几份文件，一共有近 60 万字。

然后调用模型，为了方便，我们只挑选了本次大赛的前 10 题进行测试。

大概等待 1 分钟左右，就得到了回复。智谱引经据典，提到了许多书中的内容，不过大部分都看不懂，于是用让它重新总结了一份。

我们对比了一下标准答案，十个里面对了八个，80% 的正确率。要知道，人类选手最高正确率也就才 50% 左右。

不错，整完了活，再整点干的试试。

现在的研究报告也忒多了，看也看不完，有时候用 AI 整理，出来的内容也总有幻觉，不放心。咱们就随便拿份最近在看的，来考验下 GLM-4-Long。

问了其中的一个片段，回答完全正确。

再让它总结，效果也不错。

智谱通过多个阶段的训练，逐步激活和保持模型的长文本能力。

图源GLM Long：如何将 LLM 的上下文扩展到百万级

很多人其实也不懂这个「长」到底是个啥优势，反正就跟手机内存「大」差不多的概念，谁数字大谁就是 NB 呗。

道理也差不多，在处理长篇文章或对话时，上下文窗口的长度显得尤为重要。比如，在一篇长文章中，某些信息可能在文章的开头，而相关的内容在结尾。如果上下文窗口太小，模型可能只“记得”开头的内容，而忽略了后面的关键信息，导致理解错误。

智谱的 GLM-4-Long 应用场景还是很多的，比如?

1. 长文本分析能力：能够深入分析数十万字的文本内容，为学术研究、法律审查和历史研究等提供有力的支持。

2. 文档摘要生成：能够从长篇大论中提炼出精炼的摘要，捕捉并呈现文章的核心要点，为读者节省时间。

3. 信息检索效率：在面对海量文档需要检索特定信息时，GLM-4-long展现出其快速定位和信息提取的能力，极大地提高了工作效率。

4. 自然语言推理：该工具能够处理复杂的逻辑关系和推理任务，尤其适用于需要对文本中的论点进行深入分析和逻辑推理的应用场景。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

MCP超市：百度上线AI开放计划

2025-04-26

从Function Call到MCP：大模型如何调用外部工具

2025-04-26

增量代码自动Review工具：洞窝在AI上的探索和实践

2025-04-25

OpenAI 白送 200 美元的深度研究功能？实测后发现这个「阉割版」不如不用

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

2025-04-25

医疗大模型案例分析（一）：Google Med-PaLM

2025-04-25

vLLM+Qwen-32B+Open Web UI构建本地私有大模型

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB