微信扫码
添加专属顾问
我要投稿
pip install gptpdf以下是一段实用的 Python 代码示例:
from gptpdf import parse_pdfapi_key = 'your_openai_api_key'pdf_path = 'your_pdf_file_path'content, image_paths = parse_pdf(pdf_path, api_key=api_key)print(content)
content, image_paths = parse_pdf(pdf_path='path/to/your/pdf',output_dir='./output',api_key='Your OpenAI API Key',base_url='https://api.openai.com/v1',model='gpt-4o',verbose=True,gpt_worker=4)
def parse_pdf(pdf_path: str,output_dir: str = './',prompt: Optional[Dict] = None,api_key: Optional[str] = None,base_url: Optional[str] = None,model: str = 'gpt-4o',verbose: bool = False,gpt_worker: int = 1,**args) -> Tuple[str, List[str]]:
prompt:主要用于指导模型如何处理和转换图片中的文本内容。
rect_prompt:用于处理图片中标注了特定区域(例如表格或图片)的情况。
role_prompt:定义了模型的角色,确保模型理解它在执行PDF文档解析任务。您可以用字典的形式传入自定义的提示词,实现对任意提示词的替换,这是一个例子:
prompt = {"prompt": "自定义提示词语","rect_prompt": "自定义提示词","role_prompt": "自定义提示词"}content, image_paths = parse_pdf(pdf_path=pdf_path,output_dir='./output',model="gpt-4o",prompt="",verbose=False,)
您不需要替换所有的提示词,如果您没有传入自定义提示词,仓库会自动使用默认的提示词。默认提示词使用的是中文,如果您的PDF文档是英文的,或者您的模型不支持中文,建议您自定义提示词。
参考引用资料:
gptpdf 官方文档:https://github.com/cosmosshadow/gptpdf
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-25
混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA
2025-11-25
5分钟部署AstrBot+NapCat:用Docker把 DeepSeekAI接入你的QQ
2025-11-25
OpenAI 推出 Shopping Research:AI 正在重塑电商价值链
2025-11-25
Gemini Prompt:直接开源!我把「顶尖商业咨询」写进了一套 AI 指令里
2025-11-24
字节跳动开源RL框架verl:让大模型强化学习效率提升20倍,已支持671B参数模型训练
2025-11-24
GPUStack v2:推理加速释放算力潜能,开源重塑大模型推理下半场
2025-11-23
一行代码,让你的 AI 拥有永久记忆!告别昂贵的向量数据库
2025-11-23
Andrej Karpathy 推出 LLM Council:让多个大模型"开会"讨论你的问题
2025-09-07
2025-09-06
2025-10-20
2025-09-08
2025-10-27
2025-10-27
2025-11-19
2025-10-03
2025-09-17
2025-09-29
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17