我要投稿

腾讯混元自研深度思考模型「T1」正式发布

发布日期：2025-03-22 03:33:41 浏览次数： 1548 来源：腾讯混元

今天，我们正式推出自研深度思考模型混元T1正式版。

「T1」吐字快、能秒回，还擅长超长文处理，是腾讯自研的强推理模型。

通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步提升了推理能力。

在体现推理模型基础能力的常见benchmark上，如大语言模型评估增强数据集MMLU-PRO中，混元T1取得87.2分，仅次于o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元T1的成绩也达到业界领先推理模型的水平。

「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

注：表格中，其它模型的评测指标来自官方评测结果，官方评测结果中没有的部分来自混元内部评测平台结果

混元T1正式版沿用了混元Turbo S的创新架构，采用Hybrid-Mamba-Transformer 融合模式。

这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

这一架构有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用，从而显著降低了训练和推理成本。

混元T1在超长文本推理领域也展现出独特优势。

基于出色的长文捕捉能力，混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合Mamba架构针对长序列处理进行了专项优化，通过高效的计算方式，在确保长文本信息捕捉能力的同时大幅降低资源消耗，在相近的激活参数量下，实现了解码速度提升2倍

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-03-22

Cursor 被爆致命隐患，YOLO 模式正成黑客新宠！

2025-03-22

MCP：跨越AI模型与现实的桥梁

2025-03-22

爆火 | API终将淘汰，MCP+Milvus+LLM才是Agent开发新范式

2025-03-22

当 OpenAI 和 Anthropic 进入应用层，且不再提供 API 时

2025-03-22

跟硅谷创业者聊 Agent：今年创业做 Agent，技术卡点在哪里？

2025-03-22

我终于拿到Manus邀请码，体验教程新鲜出炉！

2025-03-22

王兴首次谈AI：美团的策略是进攻而非防守，今年将推AI生活助手｜钛媒体AGI

2025-03-22

多模型协作：Deepseek R1思考再调大模型？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

跟硅谷创业者聊 Agent：今年创业做 Agent，技术卡点在哪里？

2025-03-22

多模型协作：Deepseek R1思考再调大模型？

2025-03-22

DeepSeek干掉OpenAI，还要多久？

2025-03-22

DeepSeek搅动云市场：独立AI云厂商是否正在崛起？

2025-03-22

OpenAI凌晨发布三款语音模型，语音AI Agent时代即将到来？

2025-03-22

ChatGPT o3与DeepSeek R1性能对比，谁更强？

2025-03-21

Model Context Protocol (MCP) 与传统 Function Calling 到底什么区别,怎么选?

2025-03-21

Anthropic 的模型上下文协议（MCP）适合您吗？

2025-03-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB