微信扫码
添加专属顾问
我要投稿
一款基于多模态大语言模型的PDF转Markdown工具,助力文档高效转换,保留复杂排版元素。 核心内容: 1. 项目简介与功能特性:MarkPDFDown工具实现PDF到Markdown的高质量转换 2. 安装指南与使用示例:详细步骤介绍如何在不同环境下使用MarkPDFDown 3. 贡献指南与开源协议:项目开源协议介绍及如何贡献代码
基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9
conda activate markpdfdown
# 克隆仓库
git clone https://github.com/jorben/markpdfdown.git
cd markpdfdown
# 安装依赖
pip install -r requirements.txt
# 设置OpenAI API密钥
export OPENAI_API_KEY=<你的API密钥>
# 可选设置API端点
export OPENAI_API_BASE=<你的API端点>
# 可选设置默认模型
export OPENAI_DEFAULT_MODEL=<你的模型>
# 运行转换程序
python main.py < tests/input.pdf > output.md
# 转换指定页码范围python main.py 起始页码 结束页码 < tests/input.pdf > output.md
docker run -i -e OPENAI_API_KEY=<你的API密钥> -e OPENAI_API_BASE=<你的API端点> -e OPENAI_DEFAULT_MODEL=<你的模型> jorben/markpdfdown < tests/input.pdf > output.md
requirements.txt
欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat
)git commit -m 'feat: 添加XX新功能'
)git push origin feature/somefeat
)本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-16
Seedream 3.0 文生图模型技术报告发布
2025-04-14
DupDub 插件登陆 Dify Marketplace,带来强大的音频 AI 能力
2025-04-14
Google Gemini 2.0 网页抓取真丝滑
2025-04-14
关于 GTP-4o 图片生成的10个赚钱方向
2025-04-14
Gemma3+Mistral-OCR+RAG:实现多模态文档问答系统
2025-04-11
成功率提高7倍!新方法一句话就能让AI秒出分子设计+合成步骤
2025-04-11
多模态视觉理解大模型推理优化
2025-04-09
99%的人不知道Claude的一句话生成SVG图片功能
2024-09-12
2024-06-14
2024-08-06
2024-06-17
2024-08-30
2024-05-30
2024-10-07
2024-11-28
2024-10-16
2024-04-21
2025-04-08
2025-04-05
2025-03-30
2025-03-26
2025-03-05
2025-03-02
2025-01-08
2024-12-13