我要投稿

揭秘AI内部机制：AI理解的重大突破

发布日期：2025-04-06 05:07:29 浏览次数： 1536 作者：清熙

Anthropic本周连发两篇相互关联的大模型内部机制研究报告【文献1、文献2】：

构建了AI“显微镜”，并用它追踪了大模型思维，这是继去年揭秘大模型黑盒之后的重大进展。

【文献1】构建了替代模型（replacement model）作为AI“显微镜”

通过这个替代模型，亦步亦趋的捕获针对每一个提示语的归因图（attribution graph）

归因图用于描述模型在特定输入提示下生成目标词元输出时所经历的推理步骤。

归因图的边表征节点间的线性影响关系，节点代表以下对象：

激活的特征
输入提示中的词元嵌入
重构误差
输出逻辑值

每个特征的活动强度由其输入边的权重之和决定。

归因图展示了特征如何在特定输入提示下相互作用以生成模型输出。

而特征在所有上下文环境中交互的全局图景更值得关注，全局交互由模型权重决定：

相邻层神经元间的直接影响就是它们之间的连接权重；若神经元间隔较远，则影响会通过中间层传递。

这本质上是笔者在降低大模型幻觉的必由之路中描述的 Transformer视角下的范畴中采样，即在复杂高维的对象米田嵌入图中的采样路径。

学者们接着在【文献2】中应用此AI“显微镜”对自家大模型Claude 3.5 Haiku在多种情景下内部机制做了“生物学”探查，非常有趣。

笔者关注到两个情景：诗歌中的规划和多语言电路，很有感触和共鸣。

诗歌规划，研究发现大模型在写诗行时提前计划其输出：

在开始编写每一行之前，模型会识别可能出现在末尾的押韵单词，预先选择的押韵选项将决定模型构建整行的方式。

这颠覆了大模型仅仅做下一个词元预测的流行的行业错误认知，大模型是这么学习语料的，但不代表也是这么推理生成的。

诗词韵律规划更符合笔者在MIT对大模型数理原理的强有力证明中描述的采样过程：

“在外部感官输入下（被提示置于某种上下文），大模型内部将限定在相应的高维语言概率空间的子空间内推理；推理是在子空间中采样，类比时跨范畴采样；

采样不断进行，基于内部概率化了的世界模型（预训练获得的先验），针对感官输入（提示），做变分推断，最小化自由能，获取最佳采样分布q*，作为对导致感官输入的外部后验的预测。”

多语言电路，研究发现大模型混合使用了“特定于语言的”，和“抽象的、独立于语言的”电路，更大的模型中，“抽象的、独立于语言的”成分更突出。

这非常贴切的印证了笔者在 DeepSeek R1 & R2 技术原理中，对大模型中不同层次/尺度语言处理机制的描述：

人类与大模型的语言体系中具有共通的三层结构：

自下而上，基础“信息概率分布”处理体系；
自然语言如语音或词句文章；
符号语言如代码、数学公式等。

而推理不过是在LLM构建的高维概率语言空间里，对信息概率分布采样做变分；

这个过程可以映射到不同的上层自然语言，以及对应的语音，甚至进一步映射到某种符号语言 - 代码或数学公式；

而抽象的符号语言也可以用自然语言描述，从而进一步转换为对信息概率分布的处理过程。

Anthropic团队对大模型内部机制的探索不断取得重要进展，越来越接近模型本质的机理。与目前来自Nature，Science，学术界，企业界的几十项研究成果一样，均指向这一数理认知框架。

文献1 https://transformer-circuits.pub/2025/attribution-graphs/methods.html

文献2 https://transformer-circuits.pub/2025/attribution-graphs/biology.html

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-06

阿里巴巴MNN在端侧大模型高效部署上的技术创新与实践

2025-04-06

VSCode发布Agent+MCP，Cursor劲敌又回来了？

2025-04-06

Llama 4 发布：我看到了 DeepSeek 的影子

2025-04-06

一文读懂英伟达世界模型平台 Cosmos

2025-04-06

深入解析Agentic AI架构：如何打造自主决策的智能体？

2025-04-06

一起聊聊Nvidia Hopper新特性之WGMMA

2025-04-06

又刷屏了，昆仑万维奇袭音乐大模型

2025-04-06

64张图，看懂AI Agent的核心技术与未来

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

VSCode发布Agent+MCP，Cursor劲敌又回来了？

2025-04-06

深入解析Agentic AI架构：如何打造自主决策的智能体？

2025-04-06

大语言模型是如何推理的？

2025-04-05

Transformer到底解决什么问题？

2025-04-02

Playwright + DeepSeek实战：如何让AI“看懂”网站页面内容？自动定位页面元素？

2025-04-02

伯克利大学35页综述：多智能体LLM系统为何会失败？

2025-04-01

【深度】一文解读Claude如何思考——大模型是真懂是装懂？

2025-04-01

AI Agent：大模型落地应用的“最后一公里”？

2025-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

揭秘AI内部机制：AI理解的重大突破

人类与大模型的语言体系中具有共通的三层结构：

自下而上，基础“信息概率分布”处理体系；

自然语言如语音或词句文章；

符号语言如代码、数学公式等。