微信扫码
和创始人交个朋友
我要投稿
https://github.com/gomate-community/GoMate/blob/main/docs/mineru.md
- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口
支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等
请见PDF-Extract-Kit
:https://github.com/opendatalab/PDF-Extract-Kit/blob/main/README-zh_CN.md
PDF文档中包含大量知识信息,然而提取高质量的PDF内容并非易事。为此,我们将PDF内容提取工作进行拆解:
布局检测:使用LayoutLMv3模型进行区域检测,如图像,表格,标题,文本等;公式检测:使用YOLOv8进行公式检测,包含行内公式和行间公式;公式识别:使用UniMERNet进行公式识别;表格识别:使用StructEqTable进行表格识别;光学字符识别:使用PaddleOCR进行文本识别;
阿里云地址:docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.2-models
dockerhub地址:docker pull quincyqiang/mineru:0.2-models
docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models
具体截图请见博客:https://blog.csdn.net/yanqianglifei/article/details/141979684
访问地址:
http://localhost:8888/docs
http://127.0.01:8888/docs
返回内容字段包括:dict_keys(['layout', 'info', 'content']) 其中content是一个字典列表:
{
'type': 'text',
'text': '现在我们知道:价值实体就是劳动;劳动量的尺度就是劳动持续时间。',
'page_idx': 5
}
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-22
以接近零的成本运行 OpenAI Swarm 多 Agent 框架
2025-02-22
一觉醒来,DeepSeek开始“领导”公务员了?
2025-02-22
全国第一例警用 DeepSeek 大模型落地成都高新区:科技赋能警务的创新变革
2025-02-22
AI Agents 技术演进与未来图景:从工具执行者到 AGI 参与者
2025-02-22
橘子对话华创:DeepSeek加速AGI,现在入场正当时
2025-02-22
为什么马斯克认为 Google 才是xAI的终极对手?
2025-02-22
工业大模型:破局工业“觉醒时代”的“三重门”
2025-02-22
通义千问与文心一言对比评测:谁才是苹果AI的“黄金搭档”?
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-04-26
2024-08-04
2024-07-31
2024-07-09
2024-09-17
2025-02-22
2025-02-22
2025-02-22
2025-02-22
2025-02-21
2025-02-20
2025-02-19
2025-02-16