微信扫码
添加专属顾问
我要投稿
探索AI模型与外部交互的新标准,MCP协议的诞生与应用。 核心内容: 1. AI发展中MCP和Computer Use概念的兴起 2. MCP协议的定义与作用:统一AI与外部数据交互的标准 3. 技术演进:MCP协议如何简化AI模型与外部接口的交互流程
由于DeepSeek的一把大火,大家对于今年AI的发展一直呈现火热的关注,近来Manus续了一波,Agent的概念再次火了起来。
于是一些低频名词又重新进入视野,甚至被抬得很高,比如computer use、MCP,先聊聊MCP...
Model Context Protocol (MCP) 是Anthropic开发一种开放标准协议,它可以让AI模型能够安全地访问和交互外部数据和工具。
与http协议类似,就是一个约定俗成的标准,只要大家遵守即可。
MCP出现的缘由很简单,大模型要真正的解决问题,一定需要与各种外部接口做交互,包括浏览器、数据库、文件系统...
在MCP提出之前,我们如果需要外部信息是怎么玩的呢?答案是定制化。
写一个中间程序,直接去调用大模型(获取请求),拿到大模型请求后、再调用API进行数据库读写、或者通过大模型返回的一些参数,再进行API调用,总而言之,用户访问的其实是中间程序,中间程序完成了大模型能力扩展的弥合。
但是有个人不爽:觉得不应该存在中间程序这种奇葩存在,于是他先在模型底层实现了固定格式的API调用,于是后续用户便可以直接访问大模型,而大模型可以自动调用该API进行数据库读写。
后续又衍生出文件读写、浏览器读写等需求,为了提升效率就沿用了之前的标准,最后发现挺好用,就形成了协议。
有了MCP后,AI与外部世界的交互有了统一标准,使 AI 应用能够无缝集成外部数据源和工具。
在没有 MCP之前,每个开发者都需要创建自己的方法让 AI 与外部世界交互,这导致了大量不兼容的系统和安全漏洞。
以上就是非常粗暴的描述,大家自己理解吧,没什么好说的...
为加深理解,这里还是随便补充点内容,其实MCP没什么好说的,按照要求写即可...
用户 → 中间程序 → 大模型 → 中间程序 → API → 返回结果
实际技术演进:
# 传统适配层伪代码
user_input = "查北京天气"
model_response = llm(user_input) # 模型可能输出 "需要调用天气API,城市=北京"
if "天气API" in model_response:
city = extract_city(model_response) # 开发者自行编写解析逻辑
result = call_weather_api(city) # 手动调用API
MCP 阶段:
并非完全消除中间程序,而是将其标准化为协议层。流程变为:
用户 → 模型 → MCP客户端(结构化请求)→ MCP服务器(协议转换)→ API → 返回结果
- **关键升级**:模型直接输出标准化指令(如 JSON 格式),MCP 协议层替代了定制化代码
---
### 二、核心差异:协议层 vs 模型能力
| **维度** | **传统模式** | **MCP 模式** |
|----------------|-----------------------------|---------------------------------|
| **调用发起方** | 开发者代码触发 API 调用 | 模型自主生成 MCP 指令 |
| **接口规范** | 每个 API 需独立对接 | 统一遵循 MCP 协议格式 |
| **安全控制** | 依赖开发者实现权限管理 | 协议层内置沙箱与权限策略 |
**典型案例对比**:
- **无 MCP**:模型输出 "请调用天气API查北京",需开发者写正则表达式提取参数
- **有 MCP**:模型直接输出结构化指令:
```json
{
"action": "query_weather",
"params": {"location": "北京"},
"auth_scope": "user_weather"
}
Computer Use也是由Anthropic(Claude母公司)在2024年10月推出。
目标是让AI像人类一样操作电脑:看屏幕、动光标、点按钮、打字,再这个基础上再扩展功能,比如帮订机票、填表格、查天气。
事实上之前这个自动化工作**RPA一直在做而且做得挺好的。
Computer Use 可以理解为RPA都是扩展能力,操作电脑的行为,只不过底层是完全不同的逻辑。
Computer Use,是在接受任务后列出行动计划,并根据实时的屏幕变化进行下一步的思考、计划和操作。他可以对未知的工作进行主动探索和试错;
而RPA更多的是流程固定化操作,这是巨大的差异。长时间来看,Computer Use可能会令RPA公司感到绝望...
技术实现为:通过截屏+虚拟键盘鼠标模拟人类操作,类似于“教会实习生用电脑”。
目前仍处于测试阶段,操作速度慢,错误率较高。
意义也很简单:脱离RPA这类工具,大模型自己能玩电脑了...
与MCP一样暂时噱头过多,持续关注即可,真的成熟会有很完善的文档,完全不必焦虑
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-23
2025-03-22
2025-03-22
2025-03-22
2025-03-22
2025-03-22
2025-03-21
2025-03-21