我要投稿

Fetch MCP网页内容抓取实操：抓取“刘强东送外卖”新闻案例详细教程！

发布日期：2025-04-29 12:19:30 浏览次数： 1521 作者：MCP Server

在平时工作中我们经常会遇到要从互联网获取相关信息内容需求，但是往往只有需求却缺乏一个好的工具，来解决网页内容抓取这个让人麻爪的问题。

今天我们就给大家推荐一款简单好用的网页内容抓取工具Fetch MCP！

我们先了解下Fetch，Fetch是一个简单易用且强大的功能网页内容抓取工具，被我们广泛的用在开发、数据分析以及自动化测试等领域。

Fetch是基于Promise的API，它的工作流程主要包括以下几个步骤：

首先是创建请求，通过调用 fetch() 函数+传入目标URL地址，向服务器发送一个请求。这个请求可以包含各种可选参数，如请求方法（GET、POST 等）、请求头、请求体等。

第二步骤发送请求，Fetch会将请求发送到指定的服务器，并等待服务器的响应，在等待过程中，会自动处理网络连接、DNS 解析以及TCP连接等底层细节，不需要我们用户手动干预。

最后是处理响应，当服务器返回响应后，Fetch 会将响应封装成一个 Response对象，这个对象包含了响应的HTTP状态码、响应头以及响应体等信息。

通过检查响应状态码（比如“200”表示成功），可以确定请求是否成功，对于成功的请求，可以进一步从响应体中提取所需的数据，常见的数据类型包括 JSON、文本（text）以及二进制数据（如 Blob 或 ArrayBuffer）等。

Fetch 的优点

简单易用 ：Fetch的语法非常简洁明了，与传统的XMLHttpRequest相比，Fetch避免了繁琐的事件监听和回调函数的嵌套，这就让代码更加清晰和易于维护。比如，使用Fetch 发送一个GET请求并获取 JSON 数据的代码可以简化为：

fetch(url).then(response => response.json()).then(data => console.log(data)).catch(error => console.error('Error:', error));

基于Promise ：由于Fetch 基于Promise实现，因此可以很方便地与其他基于Promise 的异步进行操作组合和链式调用。这就让我们开发人员能够更加灵活地处理复杂的异步逻辑，避免了回调地狱的问题，并且可以轻松地应用Promise的各种方法，比如 then()、catch()、finally() 等，来控制程序的执行流程和错误处理。

浏览器兼容性好 ：Fetch几乎支持我们平时用到的所有主流浏览器，包括 Chrome、Firefox、Safari、Edge 等等，这项优点的应用场景在于，在不同浏览器环境下，可以使用相同的Fetch API进行网页内容抓取，减少了因浏览器差异带来的兼容性问题。

灵活性强 ：Fetch 提供了丰富的可选参数，支持开发人员自定义请求的各种属性。例如，可以指定请求方法（如 POST、PUT、DELETE 等）、设置请求头（如 Content-Type、Authorization 等）、添加请求体（用于发送数据到服务器）、配置超时时间等。

什么是Fetch MCP？Fetch MCP 是基于 Model Context Protocol (MCP) 的一种轻量级网页爬虫服务器。

Fetch MCP在Fetch的基础上进行了功能拓展和优化，为大语言模型提供了更高效、更智能的网页内容抓取服务，下面我们来看下Fetch MCP的详细功能：

内容抓取与转换 ：能够从互联网获取指定URL的内容，并将其转换为Markdown格式，还可选择以 HTML、JSON 或纯文本格式返回结果。

参数灵活可调 ：

url（字符串，必需）：指定要抓取的网页地址。
max_length（整数，可选，默认 5000）：设置返回内容的最大字符数，可避免获取过多无用信息，提高效率

start_index（整数，可选，默认 0）：从指定字符索引位置开始提取内容，方便分块获取网页内容，便于模型按需读取。
raw（布尔值，可选，默认 false）：若设为 true，则获取原始内容而不进行 Markdown 转换。

Fetch MCP的技术优势

极简架构 ：安装部署简单，通过单命令即可启动服务，不需要复杂依赖环境，如使用 UV 运行时，直接运行 uvx mcp-server-fetch 就可以。

智能转换引擎 ：内置 HTML-to-Markdown 解析算法，可以准确提取正文内容，并且过滤广告等噪声数据，输出较为纯净、结构化的 Markdown 格式内容，方便我们后续处理和分析。

原生适配LLM 生态：输出格式天然适配ChatGPT、Claude 等大模型，可以直接将抓取的网页内容作为大模型的输入。

Fetch MCP的应用场景

内容聚合：可批量抓取新闻站点、博客等的头条内容，设置合适的max_length和start_index参数，就可以为构建行业资讯监控系统提供数据支持。

竞品分析 ：实时监控电商平台商品价格变动，结合定时任务和start_index参数定位价格信息，还可通过raw模式获取原始HTML，再利用XPath解析等技术，实现对竞品信息的精准抓取和分析。

智能助手开发：作为知识库构建的数据管道，抓取技术文档网站内容，转换为Markdown 后存入向量数据库，供LLM检索和增强生成效果，提升智能助手的知识储备和回答质量。

Fetch MCP如何配置使用？

安装开始

Step1：使用 uv（推荐），当使用 `uv` 时不需要复杂的安装步骤，使用 `uvx` 直接运行 mcp-server-fetch即可。

使用 PIP，或者，您可以通过 pip 安装 `mcp-server-fetch`：

pip install mcp-server-fetch

安装后，您可以使用以下命令以脚本方式运行它：

python -m mcp_server_fetch

Step2：MCP客户端这里我们以Claude 配置为例进行讲解，首先官方下载Claude客户端，最好是最新版。

安装好Claude客户端后，进入功能页面，点击左上角“文件”->"首选项"->“Cursor Settings”进入到MCP配置页面。

进入到MCP菜单页面后，点击右侧蓝色按钮“Add new global MCP server”进行mcp.json文件配置。

在您的mcp.json设置中添加如下内容：

"mcpServers": {  "fetch": {    "command": "uvx",    "args": ["mcp-server-fetch"]  }}

添加完成后效果如下图：

以上我们就完成了Fectch MCP配置工作！

使用方法：

下面我们以抓取今天的一个热点新闻“刘强东身穿京东外卖骑手工服送外卖”为案例，看下Fectch MCP到底如何抓取这个新闻，并生成一个静态HTML新闻页面。

方法很简单，我们只需要把准备好的文案（包含新闻链接）直接在Cursor会话窗口输入就OK！

文案内容如下：

@https://baijiahao.baidu.com/s?id=1830064276188136180&wfr=spider&for=pc ,根据链接抓取刘强东送外卖新闻内容，包括图片，生成一个静态html新闻页面！

我们可以看到文案发出后，Claude已经开始调用fetch工具进行网页内容抓取.

百度的链接访问限制，fetch在这里自动换了个链接，抓取相关的新闻，如下图所示。

html新闻静态页面默认生成到了桌面，如下图：

我们打开看下效果：漂不漂亮！（除了图片没有抓取到）

没抓到的图片在这里，手工补上哈哈：

如下图是Claude客户端的整个调用过程：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

Prompt 练习｜教育中的等待现象

2025-04-29

AI 友好架构：AI 编程最佳范式，构建 10x 效率提升的代码库（万字长文）

2025-04-29

技术为何无法帮助我们思考？从笔记软件的局限性谈起

2025-04-29

豆包是懂PDF论文阅读的

2025-04-29

提升思维！普通人如何像AI一样去深度思考？

2025-04-29

又见2050：用AI重塑产品工作流

2025-04-28

明超平 AI Coding 创业项目曝光：Vibe Coder 社区

2025-04-28

AI 编程之手把手教你实现用4o打造拍立得风格图片转换器（含源代码）

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Manus横空出世，如何获取邀请码

2025-03-06

Kimi、豆包与ChatGPT的对比分析

2024-09-04

从探索到落地：全面解析2024年AI在各行业的突破与应用

2025-01-25

国内用户如何使用ChatGPT高级实时语音功能教程

2024-09-26

豆包AI全攻略：八大功能详解与实操指南

2024-10-30

看完这篇，终于知道怎么选AI做PPT的工具了！

2024-09-03

让大模型写小说太难？试试雪花十步写作法，轻松突破瓶颈！

2024-12-11

新手必看：Cursor软件编写微信小程序全攻略

2024-12-25

对话Kyth：小宇宙CEO如何理解AI播客？

2024-10-30

深度复盘｜做AI产品近2年总结出来的25条核心认知

2025-02-18

大家都在问

提升思维！普通人如何像AI一样去深度思考？

2025-04-29

ARR数据造假算是本轮 AI 创业骗术 top3 了吧？

2025-04-25

AI 代码编辑器中的智能体模式到底是什么？

2025-04-22

DeepSeek生成的Html网页，怎么分享给别人访问？

2025-04-16

专访Answer.AI创始人周立：AI时代，学什么在未来是有用的？

2025-04-15

Agent落地有哪些挑战？如何应对？

2025-04-13

AI创业的真相：从"脏活累活"到成功秘诀，谁在决定AI的未来？

2025-04-07

AI会改变知乎和小红书吗？

2025-03-25

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

Fetch MCP网页内容抓取实操：抓取“刘强东送外卖”新闻案例详细教程！

安装开始

Step1：使用 uv（推荐），当使用 uv 时不需要复杂的安装步骤，使用 uvx 直接运行 mcp-server-fetch即可。

使用 PIP，或者，您可以通过 pip 安装 mcp-server-fetch：

Step1：使用 uv（推荐），当使用 `uv` 时不需要复杂的安装步骤，使用 `uvx` 直接运行 mcp-server-fetch即可。

使用 PIP，或者，您可以通过 pip 安装 `mcp-server-fetch`：