支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


微软又整活!MarkItDown-MCP:网页/文件一键转Markdown,还能直接喂给AI用!(支持Claude)

发布日期:2025-04-21 14:06:32 浏览次数: 1560 作者:YourwayAI
推荐语

微软AutoGen团队的最新开源项目,一键转换网页和文件为Markdown,支持AI模型。

核心内容:
1. MarkItDown-MCP:轻量级网页/文件转Markdown工具
2. 支持多种URI输入和MCP协议,无缝对接AI模型
3. 两种运行模式,快速上手安装与运行指南

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家


导语:

还在为手动转换网页文章、本地文档到 Markdown 格式而头疼?想不想让你的 AI 助手(比如 Claude)也能轻松读取并处理各种来源的内容?微软 AutoGen 团队带来了福音——开源项目MarkItDown-MCP!这款轻量级工具能将网页链接、本地文件甚至数据 URI 直接转换为干净的 Markdown,最酷的是它原生支持MCP (模型上下文协议),能无缝对接 AI 模型!特别适合需要高效处理信息的学生、内容创作者以及玩转 AI Agent 的技术爱好者们!

正文:

1. MarkItDown-MCP 是什么?

简单来说,MarkItDown-MCP 是一个专注于格式转换的小工具,它提供了一个核心功能,并通过 MCP 协议将其暴露给 AI 或其他程序:

  • 核心工具函数:convert_to_markdown(uri)
  • 强大兼容性:支持多种 URI (统一资源标识符) 类型作为输入:
    • http:/https:(网页链接)
    • file:(本地文件路径)
    • data:(Base64 编码等数据)
  • MCP 支持:将转换功能封装为 MCP 工具,方便 AI 模型(如 Claude Desktop)发现和调用。
  • 轻量设计:专注于做好 Markdown 转换这一件事,简单高效。
2. 两种运行模式,灵活适配

MarkItDown-MCP 提供了两种运行模式,满足不同场景需求:

  • ① STDIO 模式 (标准输入/输出):
    • 运行方式:直接在命令行运行markitdown-mcp
    • 优点:最简单,无需启动服务器,适合本地脚本调用或与支持 STDIO 的 MCP 客户端(如mcp-proxy或某些本地 Agent 框架)集成。
    • 运行方式:通过 HTTP 服务器提供服务,命令如markitdown-mcp --sse --host 127.0.0.1 --port 3001
    • 优点:适合需要通过网络访问转换功能的场景,或者与支持 SSE 的 MCP 客户端(如 Cursor)直接连接。
3. 快速上手:安装与运行

上手非常简单:

  1. 1.安装:(需要 Python 环境)
    pip install markitdown-mcp
  2. 2.运行:
  • 运行 STDIO 模式 (默认):
    markitdown-mcp
  • 运行 SSE 模式 (指定地址和端口):
    markitdown-mcp --sse --host 127.0.0.1 --port 3001
    (服务器将在http://127.0.0.1:3001/sse提供服务)

推荐使用 Docker来运行 MarkItDown-MCP:

  1. 1.构建 Docker 镜像:(需要安装 Docker)
  • • 下载项目代码 (或仅 Dockerfile)。
  • • 在项目根目录运行:
    docker build -t markitdown-mcp:latest .
  • 2.
    • claude_desktop_config.json
      文件 (具体位置请参考 Claude Desktop 文档)。
    • • 在mcpServers部分添加以下条目:
      {
        "mcpServers":{
          "markitdown":{
            "command":"docker",// 使用 docker 命令
            "args":[
              "run",      // 运行容器
              "--rm",     // 容器退出后自动删除
              "-i",       // 保持 STDIN 打开,即使没有附加 (交互模式所需)
              "markitdown-mcp:latest"// 使用你构建的镜像
            ]
          }
      }
      }
  • 3.(可选) 访问本地文件:如果你想让 Claude 通过 MarkItDown-MCP 读取你电脑上的本地文件,需要在 Dockerrun命令中挂载本地目录:
    • • 例如,将本地的/home/user/data目录挂载到容器内的/workdir
      {
        "mcpServers":{
          "markitdown":{
            "command":"docker",
            "args":[
              "run","--rm","-i",
              "-v","/home/user/data:/workdir",// 添加卷挂载
              "markitdown-mcp:latest"
            ]
          }
      }
      }
    • • 之后,你就可以让 Claude 使用file:///workdir/your_file.txt这样的 URI 来访问/home/user/data目录下的文件了。

    为什么推荐 Docker?Docker 可以隔离运行环境,避免 Python 依赖冲突,并且方便管理服务的启停,特别适合与 Claude Desktop 这种需要稳定后台命令的应用集成。

    5. 调试与资源
    • 调试工具:可以使用官方推荐的mcpinspector工具来检查 MCP 服务器是否正常工作。
      npx @modelcontextprotocol/inspector
      然后根据提示在浏览器中连接 STDIO 或 SSE 服务进行调试。
    • PyPI 地址:https://pypi.org/project/markitdown-mcp/
    • 项目来源:由微软 AutoGen 团队构建。
    • GitHub:https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp
    6. 安全提示
    • • 该服务器没有内置身份验证机制。
    • • 它以运行它的用户的权限运行。
    • • 因此,在SSE 模式下运行时,强烈建议将其绑定到localhost(即127.0.0.1,这是默认行为),避免暴露到不安全的网络中。

    总结:

    MarkItDown-MCP 是一个小而美的实用工具,它不仅简化了将各种内容转换为 Markdown 的过程,更重要的是通过MCP 协议打通了与 AI 模型(如 Claude)的连接,让 AI 能够更方便地利用外部信息。无论你是想提高内容处理效率,还是想为你的 AI Agent 添加新能力,MarkItDown-MCP 都值得一试!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询