微信扫码
添加专属顾问
我要投稿
探索AI领域的专业术语,揭开LLM、MCP、EMB的神秘面纱。 核心内容: 1. LLM:大型语言模型的定义、作用及技术原理 2. MCP与EMB:AI中的关键概念和应用场景 3. 代表性大模型案例分析及其局限性探讨
在很多介绍AI的文章中,会频繁出现一些名词,比如LLM、MCP、EMB。这些专业术语是什么意思,有什么作用,背后的技术原理又是什么,对普通人来说有点难以理解。
这篇文章,我会尽量用通俗易懂的语言,讲清楚这些名词到底是什么意思,作用是什么,帮助大家更好地理解AI。
一、LLM:大型语言模型
LLM的全称为(Large Language Model),即大型语言模型。它指的是一种基于深度学习技术的人工智能基础模型,通过大量的文本数据训练,来逐步具备理解和生成自然语言的能力。
LLM的基本定义主要有三个:基于深度学习、处理自然语言、参数规模庞大。其中:
LLM是自然语言处理(NLP)领域的重要组成部分,目前我们所熟知的各个大厂推出的大模型,大多都是LLM。
LLM的训练过程,就是通过自注意力机制从海量文本数据中捕捉语言模式、研发结构和语义关联,他的核心目标是通过概率建模,预测下一个词语或序列,最终生成连贯且符合上下文的文本。
这也是为什么说大模型是一个概率预测机器,为什么会出现信息幻觉的原因。
当然,因为训练数据的类型不同,大模型也有不同的能力倾向,比如金融、法律、心理、医疗等类型的数据,训练出来的大模型,其能力在对应领域的准确率更高。很多文章中提到的多模态,简单理解就是它的模型基座可以处理多种不同类型的信息。
再进一步来说,像百度文库目前的AI模型所谓的自适应能力,就可以根据用户输入对其进行分析,并自动匹配对应的领域模型。
大模型的训练过程,可以简单地分为两个部分:预训练、后训练。
在大模型领域,典型的代表性模型,大致可以分为三种:
当然,大模型目前来说依然存在局限性,主要是如下几个方面:
二、MCP:模型上下文协议
MCP的全称为(Model Context Protocol),即模型上下文协议。通俗理解的话,MCP是一种抽象的技术架构设计理念。
MCP是一种开放标准协议,旨在解决大型语言模型(LLM)与外部数据源和工具之间的通信问题,通过提供统一的接口和协议,使AI系统能够轻松地与各种外部资源进行交互,由Anthropic公司开发并开源。
MCP的基本定义:标准化的通信协议,用于建立AI模型与外部数据源之间的无缝连接。
它通过定义通用接口,允许AI助手动态访问和集成外部数据源(数据库、API、文件系统)以及工具和服务(计算工具、搜索引擎),从而扩展AI的功能并提高其效率,类似于AI领域的USB、Type-C接口。
MCP基于客户端-服务器架构,包含以下关键组件:
工作流程中,MCP Server通过分层定义能力(如数据读取、函数调用、提示模板),使AI Agent根据任务需求自动匹配工具,并通过Function Calling执行操作,例如查询数据库或调用API,最终生成多步骤的连贯响应。
MCP和传统的API接口相比,区别如下:
总结一下,MCP的技术优势主要有如下几点:
简化集成:通过统一接口降低AI与外部工具集成复杂性,避免碎片化问题。
安全性与可控性:MCP支持双向连接,确保数据安全,并提供细粒度控制。
灵活性与扩展性:MCP支持自主工作流的决策和编排,适用于多种跨平台场景。
我们可以将MCP当作AI技术领域的万能插座,通过MCP集成各种AI工具和数据源,不用做专门的适配工作。
三、EMB:数据嵌入技术
EMB全称为(Embedding),简单理解就是将低质量数据变为可参照利用的高质量基准数据的技术。
专业解释,EMB可以将高维、稀疏的离散数据(文本中的单词、图像特征或类别标签)映射到低维、稠密的连续向量空间的技术。
EMB广泛应用于自然语言处理(NLP)、推荐系统、图像处理、计算机视觉等领域。其核心思想是通过将对象(如词语、句子、用户、物品等)映射为低维向量,捕捉对象之间的潜在语义关系和相似性,从而实现降维、特征提取和建模目标。
这些向量能够捕捉原始数据的语义信息和内在关系,便于机器学习模型进行处理和分析。下图所示EMB的作用:Embedding在自然语言处理(NLP)中的典型应用场景包括:
EMB的技术特点,概括来说主要有三点:
Embedding技术目前已经在AI的各个领域深入使用,是LLM的核心技术构成之一。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-19
Exa:给 AI Agent 的 “Bing API”
2025-04-19
Chrome过时了,AI Agent需要自己的浏览器。
2025-04-19
n8n + mcp王炸组合:5个节点轻松搭建一个AI工作流
2025-04-18
火山引擎OS Agent解决方案、豆包1.5·UI-TARS模型发布
2025-04-18
前沿导读 | 基于大模型智能体的出行行为模拟
2025-04-18
大概念模型(Large Concept Models)会取代提示工程吗?
2025-04-18
AI 重要概念科普与热门技术解析
2025-04-18
我对于AI领域商业模式的思考
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-18
2025-04-16
2025-04-13
2025-04-13
2025-04-13
2025-04-12
2025-04-12
2025-04-11