支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI界的USB!MCP协议一文入门

发布日期:2025-03-19 13:27:31 浏览次数: 1548 来源:AI真香笔记
推荐语

AI技术的新突破,MCP协议带你领略AI的无限可能。

核心内容:
1. MCP协议的基本概念和功能
2. MCP架构设计和协议分层
3. 安全机制和权限控制

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

"当你对Claude说『把季度报告发到Slack』,AI竟能自动完成文件读取、摘要生成、消息发送全流程!这背后是Anthropic最新推出的MCP协议在驱动——这个被称作『AI界的USB-C』的技术,正在引发智能应用革命..."

本文将从架构设计到代码实操,带您全面了解MCP:它是什么、如何工作、能做什么、如何实现。


MCP是什么


MCP(Model Context Protocol,模型上下文协议) 是由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。它的目的是统一AI与外部世界的交互方式。它通过一套标准化规则,让AI可以安全、便捷地调用本地文件、数据库、API服务等资源,无需为每个数据源单独开发适配代码。

类比:就像USB-C接口能让手机、电脑连接各种外设(键盘、硬盘等),MCP让AI模型能无缝对接不同工具(如Excel、GitHub、区块链)。


MCP架构

架构定义

MCP架构遵循客户端-服务器架构:

  • 主机(Hosts)

指代大型语言模型(LLM)应用程序,例如Claude Desktop或集成开发环境(IDE)。 作为协议连接的发起端,负责初始化与外部资源的通信链路。

  • 客户端(Clients)

在主机应用内部运行,维护与服务器的1:1独占连接。 每个客户端实例仅绑定单一服务器,确保会话隔离与资源权限控制。

  • 服务器(Servers)

轻量级服务程序,通过标准化接口向客户端提供三类功能:

  • 上下文(Context):结构化或非结构化数据资源(如文件、数据库记录)。

  • 工具(Tools):可执行函数接口(如API调用、本地操作)。

  • 提示(Prompts):预定义的任务模板与交互逻辑。

服务器支持本地(如文件系统)与远程(如云服务)资源接入。

MCP架构(图1)

架构细节

  • 协议分层
  • 协议层:基于JSON-RPC 2.0规范定义消息框架,包括请求(Request)、通知(Notification)、结果(Result)及错误(Error)四类消息格式

  • 传输层:支持两种通信机制

  1. 标准输入输出(stdio):适用于本地进程间通信

  2. Server-Sent Events(SSE):用于远程实时双向交互。

  • 连接生命周期管理
  • 初始化阶段:通过initialize请求协商协议版本与功能支持范围

  • 会话阶段:消息交换支持2种模式:请求-响应、单向通知模式。

  • 终止阶段:支持显式关闭或超时断开机制。

  • 安全机制
  • 权限分级控制:例如限制LLM仅读取特定目录文件

  • 操作审批流程:敏感工具调用需用户显式授权

  • 凭据隔离:服务器独立管理认证信息,避免泄露至客户端。

架构优势

  • 模块化扩展性

插件式开发,新功能通过独立服务器部署,无需修改主机应用代码。

  • 跨平台互操作性

标准化协议支持多语言SDK(Python/JavaScript等),适配异构系统。

  • 实时交互能力

双向通信机制支持LLM主动触发服务器操作(如代码提交、设备控制)


与Function Call对比


Function Call同样作为AI Agent中工具使用的重要成员,那么与MCP协议具体有区别呢,如下是一些对比:

对比维度
MCP协议
Function Call
通信协议
标准化的JSON-RPC 2.0或gRPC
厂商自定义的HTTP/WebSocket接口
工具生命周期管理
支持动态加载/卸载(类似Linux内核模块),无需重启服务
需重启模型服务才能更新工具
跨平台能力
工具服务可部署在任何支持协议的环境(本地/远程/容器化)
受限于模型厂商的运行时环境(如OpenAI的特定函数库)
安全边界
工具运行在独立进程/容器中,通过沙箱隔离执行风险
工具与模型共享进程内存空间,存在API密钥泄露风险

直观感受就是相当于微服务架构里面的微服务和单体应用中功能函数的区别。


应用场景


MCP协议可以将大模型变为“执行者”,下面是一些常用的应用场景:

  • 文件服务:通过Claude大模型可以对指定目录文件进行整理。

  • 数据查询:通过MCP服务端,可以对指定数据资源进行查询,如mysql,es,mongodb等等。

  • 网络搜索:通过MCP服务端,搭建网络搜索引擎,大模型可以实现网络搜索的功能。

理论上,在企业内部,通过MCP协议可以实现所有系统的互联互通。


快速入门


下面将会基于MCP协议使用python开发一个简单的天气查询的工具,通过Cursor客户端进行调用,让大家直观感受下MCP的能力。

1. 安装python包管理工具uv
# 安装uv
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
# 验证uv
uv --version
2. 初始化项目
# 初始化项目目录并使用python 3.12.0环境
uv init weather --python 3.12.0
cd weather
# 创建虚拟环境
uv venv
# 激活虚拟环境
.venv\Scripts\activate
# 安装项目依赖
uv add mcp[cli] httpx
# 创建weather.py文件
new-item weather.py
3. 编写天气查询工具服务端代码
# 使用和风天气的查询接口进行天气查询
from typing import Any
import httpx
from mcp.server.fastmcp import FastMCP

# Initialize FastMCP server
mcp = FastMCP("weather")

# Constants
API_BASE = "https://devapi.qweather.com/v7"
API_KEY = "your api key"


async def query_weather(url: str) -> dict[str, Any] | None:
    """Make a request to the NWS API with proper error handling."""
    headers = {
        "X-QW-Api-Key": API_KEY,
    }
    async with httpx.AsyncClient() as client:
        try:
            response = await client.get(url, headers=headers, timeout=30.0)
            response.raise_for_status()
            return response.json()
        except Exception:
            return None

@mcp.tool()
async def get_forecast(latitude: float, longitude: float) -> str:
    """Get weather forecast for a location.

    Args:
        latitude: Latitude of the location
        longitude: Longitude of the location
    "
""
    # First get the forecast grid endpoint
    weather_url = f"{API_BASE}/weather/7d?location={longitude},{latitude}"
    weather_data = await query_weather(weather_url)

    forecasts = []
    for period in weather_data['daily']:  # Only show next 5 periods
        forecast = f"""
{period['fxDate']} {period['textDay']}:
Temperature: {period['tempMin']}~{period['tempMax']}°C
Wind: {period['windSpeedDay']} {period['windDirDay']}
"
""
        forecasts.append(forecast)

    return"\n---\n".join(forecasts)


if __name__ == "__main__":
    # Initialize and run the server
    mcp.run(transport="stdio")

4. 验证服务是否无误
uv run weather.py

如果不报错,代表服务端代码暂时未出现问题,后面使用Cursor进行调用测试。

5. Cursor注册MCP Server
6. 添加MCP Server参数

本次演示为本地Server,所以type选择command,下一篇文章会探索远程Server的实现。Command里面填写weather.py的启动命令,注意weather.py所在目录要写完整路径。

uv --directory G:\\project\\mcp\\weather run weather.py

如果一切顺利,MCP Server应该正常注册到了Cursor客户端。

7. 使用大模型验证天气查询工具

Cursor的Compose模式下选择agent模式,聊天框输入“上海的天气怎么样”,模型会弹出运行天气查询工具的提示,点击运行,等待模型输出。

如图所示,大模型已经正确调用了天气查询的工具并整理结果给出了具体的天气查询回复。至此,一个简单的天气查询工具就实现了。

调用流程


结语


文章主要介绍了MCP协议的相关概念及其核心架构,也针对Function Call做了对比分析,最后基于实操做了一个天气查询的demo,希望大家通过本文能够对MCP有一个深刻的认识,理解并思考如何运用到实际的应用场景,感谢大家观看。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询