我要投稿

微软 Mustafa Suleyman 揭示AI未来发展路径了

发布日期：2024-11-04 12:33:55 浏览次数： 1957

作者：陳寳

微信搜一搜，关注“陳寳”

市面上人工智能的大小模型发展得很快数量也很多了，有点当年百团大战前兆的意思。个人觉得AI模型不论是大模型还是小模型，都应该在特定场景中找到自己的定位并发挥作用。

近日，微软AI主管Mustafa Suleyman在访谈中对AI趋势的讨论，提供了对当前和未来人工智能发展方向的深刻见解。

大型模型的持续演进

大型模型将继续在规模上进行竞赛，融入更多模态的数据，如视频、图像等。这种趋势表明，大型模型的性能和应用范围将进一步扩展，为AI领域带来新的突破。

随着数据量的持续增长，大型模型的训练将更加充分，性能也将得到显著提升。这将推动AI技术在各个领域的应用，如自然语言处理、计算机视觉等。

视频、图像以及跨复杂数字界面的动作轨迹等新的模态将被整合进模型中，带来许多令人印象深刻的结果。这将使AI技术更加贴近实际应用，提升用户体验。

小型模型的兴起与应用

利用大型模型训练小型模型的技术（如蒸馏）正在兴起，高效的小型模型将在特定场景中发挥巨大作用。这种技术使得小型模型能够在保持高性能的同时，降低计算成本和资源消耗。

知识将被浓缩到更小、更便宜的模型中，嵌入各种设备，实现真正的环境感知革命。这将推动物联网、智能家居等领域的快速发展，使设备更加智能化和便捷化。

小型模型蕴藏着巨大机会，创业者可以利用其低成本和高效性，开发针对特定用例的应用。这将促进创新和创业活动，推动AI技术的普及和应用。

提示工程的重要性

通过提供高质量的指令集，创业者可以引导预训练模型。使其符合自身品牌价值观，打造独特产品，这将有助于提升产品的个性化和差异化竞争力。

提示不仅仅是问题，而是指导预训练模型以特定方式行为的高质量指令集，这对于品牌价值的体现至关重要。通过精心设计的提示，企业可以塑造独特的品牌形象和用户体验。

合成数据将成为训练模型的关键，但如何获取、整合这些数据仍需深入探讨。合成数据可以弥补真实数据的不足，提高模型的训练效果和泛化能力。

⋯ ⋯

我认为人们需要更多地思考新数据的来源以及如何整合这些数据，这对于训练出更好的模型至关重要。

以下为访谈原文（部分摘要）：

Q：未来几年，在不断发展的模型 (models) 格局中，有哪些事情值得关注？

A：模型的规模既在变大，也在变小，这种趋势几乎肯定会继续下去。

去年开始流行一种新方法，称为蒸馏。这类方法利用大型、高成本模型来训练小型模型。这种监督效果相当不错，目前已有充分的证据支持这一点。

因此，规模仍然是这场竞争中的关键因素，未来还有很大的发展空间，数据量也将持续增长。

至少在接下来的两三年内，“规模法则”在提供超预期表现方面的进度不会有任何放缓。

Q: 还有哪些新的模式可以加入？

A: 人们也在考虑将视频、图像以及跨复杂数字界面的动作轨迹等新的模态融入模型中。

但我们真正感兴趣的是跨复杂数字界面的动作轨迹，比如从浏览器跳到桌面，再转移到手机，从不同的生态系统中切换，无论是在封闭的花园还是开放的网络中。

我们试图理解这些轨迹，收集大量数据，使用监督学习和微调等方法。我认为这将带来许多令人印象深刻的结果。

Q: 在数据方面，人们在哪些方面思考得不够多？

A: 数据的讨论角度很多，经典的问题是哪些数据可以使用及其质量。我认为网上已经有大量讨论。

但人们没有花足够时间思考新数据的来源，以及如何整合这些数据。

例如，合成数据是一个有趣的领域，如果我们有这样的数据，可以训练出更好的小模型和大模型。如何获取这些数据并确保其整合是一个关键问题。但是如何获取这些数据并确保它们被整合起来，这一点还没有得到足够的讨论。

Q：在处理模型时，提示 (prompt) 和问题 (question) 之间有什么区别？

A：提示不仅仅是你问聊天机器人的问题。当你问聊天机器人一个问题，那是一个问题；当你写一个三页的风格指南并附上模仿的例子，那是一个提示。

提示是你的高质量指令集，指导预训练模型以特定方式行为。令人惊讶的是，模型只需几页指令就能表现得非常不同。

为了让模型表现出细微、精准和符合品牌价值的行为，你需要展示成千上万个良好行为的例子，并将这些例子微调到模型中。这是预训练过程的延续，使用高质量且准确的数据。

好消息是，成千上万个例子对许多细分领域或特定垂直领域来说是非常容易获得的。这是一个优势，初创公司在高质量微调预训练模型方面有很大的空间。

Q：小模型会带来哪些机会？创业者如何利用它们做一些有趣且独特的事情？

A：小模型无疑代表着未来。

大型模型在处理查询时会激活数十亿个不相关的神经表示，尽管它们非常高效地进行搜索和引用数亿个节点，但并不总是必要的。

我们将把知识浓缩到更小、更便宜的模型中，这些模型可以驻留在各种设备上，如耳塞、可穿戴设备、耳环、植物或传感器。

这场环境感知革命长期以来一直被人们所期待，它将带来功能性设备，例如一个冰箱磁铁，冰箱磁铁是我能想到的最小的数字设备。它可以在早上迎接你，告诉你天气情况，告诉你冰箱里可能有什么或没有什么，并提醒你查看日历。

它可以在早上欢迎你，告诉你天气，告诉你冰箱里可能有什么或没有什么，并提醒你查看日历。

这种模型可能只有几千万个参数。虽然目前还没有人真正推动这一点，但任何两人团队都可以探索这一领域。

⋯ ⋯

打造值得信任的技术是当前最大的挑战，构建安全可靠的AI系统对于赢得用户信任至关重要。

产品化过程中情感需求是不可缺少的，这个已经在移动互联网时代很好地被验证了。AI具备提供支持的潜力，可以成为真正了解用户的伙伴，提供情感支持。

通过优化AI的情感交互能力，可以提升用户体验和满意度，进一步拓展AI技术的应用场景。

AI技术将为人类创造其他技术无法带来的情感体验，通过模拟人类情感和行为，AI 产品又可以为用户提供更加丰富和真实的交互体验。

⋯ ⋯

真理需要实践来逐一验证，在实际工程化应用过程中很重要。需要AI对话伙伴能够明确地表达边界，能够说出“这是我不准备参与的事情”，这是建立信任体验的基础。

通过明确的对话边界和规则设定，可以避免AI产生不恰当或有害的行为，保障用户权益和安全。

微软AI主管Mustafa Suleyman的观点揭示了人工智能领域的发展趋势和挑战，大小模型的齐头并进、提示工程的重要性、数据整合的挑战与机遇以及信任体验的构建等方面都值得关注。

这些趋势和挑战不仅为AI领域的研究者和从业者提供了宝贵的指导，也为普通用户描绘了一个更加智能、个性化和情感丰富的未来。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-09

垂直和领域 Agent 的下一课：上下文工程

2025-07-09

8分钟了解Deep Research与上下文工程

2025-07-09

Jina Embeddings v4 的量化感知训练

2025-07-09

AI 上新｜我让 AI「偷窥」了我的屏幕，它有机会变成我第二个大脑

2025-07-09

【速读版】Agent不同设计范式 vs 模型上下文长度

2025-07-09

提示词能力：短期是刚需，长期是辅助

2025-07-09

Agent 框架协议“三部曲”：MCP、A2A、AG-UI

2025-07-09

AI科普：带你看懂AI大模型的“参数规模”与“激活参数”

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

高效 Agents 构建指南

2025-05-23

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

大家都在问

毕业季震撼演讲：当AI重塑一切，人类的价值何在？

2025-07-08

大模型落地及Agent记忆的有趣观点：兼看SVG生成用多模态大模型怎么做？

2025-07-07

微软裁员9000人！给员工整不会了：用不用AI都要被裁？

2025-07-05

智能体（Agent）是怎么知道什么时候要调用 Tool 的？

2025-07-04

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

2025-07-03

AI 商业化，Salesforce 做对了什么？

2025-07-03

AI 编程如何在团队中真正落地？

2025-07-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB