微信扫码
添加专属顾问
我要投稿
pip install gptpdf
以下是一段实用的 Python 代码示例:
from gptpdf import parse_pdf
api_key = 'your_openai_api_key'
pdf_path = 'your_pdf_file_path'
content, image_paths = parse_pdf(pdf_path, api_key=api_key)
print(content)
content, image_paths = parse_pdf(
pdf_path='path/to/your/pdf',
output_dir='./output',
api_key='Your OpenAI API Key',
base_url='https://api.openai.com/v1',
model='gpt-4o',
verbose=True,
gpt_worker=4
)
def parse_pdf(
pdf_path: str,
output_dir: str = './',
prompt: Optional[Dict] = None,
api_key: Optional[str] = None,
base_url: Optional[str] = None,
model: str = 'gpt-4o',
verbose: bool = False,
gpt_worker: int = 1,
**args
) -> Tuple[str, List[str]]:
prompt:主要用于指导模型如何处理和转换图片中的文本内容。
rect_prompt:用于处理图片中标注了特定区域(例如表格或图片)的情况。
role_prompt:定义了模型的角色,确保模型理解它在执行PDF文档解析任务。您可以用字典的形式传入自定义的提示词,实现对任意提示词的替换,这是一个例子:
prompt = {
"prompt": "自定义提示词语",
"rect_prompt": "自定义提示词",
"role_prompt": "自定义提示词"
}
content, image_paths = parse_pdf(
pdf_path=pdf_path,
output_dir='./output',
model="gpt-4o",
prompt="",
verbose=False,
)
您不需要替换所有的提示词,如果您没有传入自定义提示词,仓库会自动使用默认的提示词。默认提示词使用的是中文,如果您的PDF文档是英文的,或者您的模型不支持中文,建议您自定义提示词。
参考引用资料:
gptpdf 官方文档:https://github.com/cosmosshadow/gptpdf
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-18
MinerU | 高精度文档解析工具:从PDF到结构化数据的智能桥梁
2025-07-18
看了这个开源的可以操作手机电脑的Agent框架,感觉AI黑灯办公室也马上出现了。
2025-07-18
00 后天才团队,发布全球首个 A 股金融博弈智能体应用
2025-07-17
基于Dify动态解析异构银行流水:架构拆解→风控报告生成
2025-07-17
亚马逊最新编程智能体Kiro系统提示词揭秘
2025-07-16
Kimi这把 “干翻”了 GPT-4?别闹,它们压根没在一个酒局!
2025-07-16
百度开源了文心4.5,我想说点实话
2025-07-16
微软开源 NLWeb,掘了数万伪AI创业者的坟
2025-06-17
2025-06-17
2025-04-29
2025-04-29
2025-07-14
2025-04-29
2025-05-29
2025-07-12
2025-05-12
2025-05-14
2025-07-16
2025-07-15
2025-07-13
2025-07-08
2025-07-04
2025-07-03
2025-06-28
2025-06-25