微信扫码
添加专属顾问
我要投稿
一款基于多模态大语言模型的PDF转Markdown工具,助力文档高效转换,保留复杂排版元素。 核心内容: 1. 项目简介与功能特性:MarkPDFDown工具实现PDF到Markdown的高质量转换 2. 安装指南与使用示例:详细步骤介绍如何在不同环境下使用MarkPDFDown 3. 贡献指南与开源协议:项目开源协议介绍及如何贡献代码
基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9
conda activate markpdfdown
# 克隆仓库
git clone https://github.com/jorben/markpdfdown.git
cd markpdfdown
# 安装依赖
pip install -r requirements.txt
# 设置OpenAI API密钥
export OPENAI_API_KEY=<你的API密钥>
# 可选设置API端点
export OPENAI_API_BASE=<你的API端点>
# 可选设置默认模型
export OPENAI_DEFAULT_MODEL=<你的模型>
# 运行转换程序
python main.py < tests/input.pdf > output.md
# 转换指定页码范围python main.py 起始页码 结束页码 < tests/input.pdf > output.md
docker run -i -e OPENAI_API_KEY=<你的API密钥> -e OPENAI_API_BASE=<你的API端点> -e OPENAI_DEFAULT_MODEL=<你的模型> jorben/markpdfdown < tests/input.pdf > output.md
requirements.txt
欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat
)git commit -m 'feat: 添加XX新功能'
)git push origin feature/somefeat
)本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-26
刚刚,OpenAI 发布生图神器狙击 Google!一句话 P 图奥特曼现场玩梗,免费能用
2025-03-26
GPT-4o 生图实测:很强(附:20+场景示例 & 缺陷整理)
2025-03-24
0.35秒OCR整页文档,比Qwen2.5 VL高出10%的文档转换多模态模型!
2025-03-24
主流多智能体框架设计原理
2025-03-21
为了致敬Manus,我做了一款产品
2025-03-21
一文搞懂多模态视觉大模型(CLIP和SAM)
2025-03-20
轻量级多模态代理框架 Agno 像搭乐高一样构建私有化AGI中台
2025-03-20
解读: Cline v3.5 在MCP交互上的升级 - 视觉化输出
2024-09-12
2024-06-14
2024-08-06
2024-06-17
2024-05-30
2024-08-30
2024-10-07
2024-11-28
2024-04-21
2024-10-16