微信扫码
与创始人交个朋友
我要投稿
项目简介
Firecrawl 是一个由 Mendable.ai 和其社区共同开发的 API 服务,它能够将整个网站转换成适用于大型语言模型(LLM)的 Markdown 或结构化数据。
该服务通过爬取网站及其所有可访问的子页面,提供干净的数据,无需网站地图。
1. API调用:
使用API密钥,通过cURL命令行工具或SDK调用Firecrawl API。
2. Python SDK
pip install firecrawl-py
from firecrawl import FirecrawlApp
app = FirecrawlApp(api_key="YOUR_API_KEY")
crawl_result = app.crawl_url('mendable.ai', {'crawlerOptions': {'excludes': ['blog/*']}})
for result in crawl_result:
print(result['markdown'])
npm install @mendable/firecrawl-js
import FirecrawlApp from "@mendable/firecrawl-js";
const app = new FirecrawlApp({
apiKey: "fc-YOUR_API_KEY",
});
const url = 'https://example.com';
const scrapedData = await app.scrapeUrl(url);
console.log(scrapedData);
注意事项: 用户在使用Firecrawl
进行抓取、搜索和爬取活动之前,应遵守适用的隐私政策和网站的使用条款。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-03-30
2024-05-28
2024-05-10
2024-04-26
2024-04-12
2024-04-25
2024-07-25
2024-05-06
2024-05-14