微信扫码
添加专属顾问
我要投稿
OmniParse 是一个强大的数据转换工具,它能够将各种非结构化数据源转化为结构化、易于操作的格式。这个平台专为与生成式人工智能(GenAI)应用程序,如大语言模型的集成而设计。
无论是文档、电子表格、图片、视频、音频还是网页内容,OmniParse 都能高效地清洗和组织您的数据,使其成为适用于如检索增强生成(RAG)和模型微调等先进人工智能技术的理想输入。
注意:目前 OmniParse 只能在 Linux 的系统上运行。这是因为某些依赖项和特定系统配置与 Windows 或 macOS 不兼容。
1.克隆项目
git clone https://github.com/adithya-s-k/omniparse
cd omniparse
2.创建虚拟环境
conda create --name omniparse-venv python=3.10
conda activate omniparse-venv
3.安装依赖
poetry install
# or
pip install -e .
docker pull savatar101/omniparse:0.1
# if you are running on a gpu
docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
# else
docker run -p 8000:8000 savatar101/omniparse:0.1
python server.py --host 0.0.0.0 --port 8000 --documents --media --web
python main.py --host 0.0.0.0 --port 8000
当 API 服务器正常启动后,就可以通过 HTTP 请求来调用 OmniParse 服务。文档解析的使用示例如下:
1.解析 PDF 文档
curl -X POST -F "file=@/path/to/document.pdf" http://localhost:8000/parse_document/pdf
2.解析 PPT
curl -X POST -F "file=@/path/to/presentation.ppt" http://localhost:8000/parse_document/ppt
3.解析 Word
curl -X POST -F "file=@/path/to/document.docx" http://localhost:8000/parse_document/docs
4.解析图片
curl -X POST -F "image=@/path/to/image.jpg" -F "task=Caption" http://localhost:8000/parse_image/process_image
5.解析视频
curl -X POST -F "file=@/path/to/video.mp4" http://localhost:8000/parse_media/video
6.解析音频
curl -X POST -F "file=@/path/to/audio.mp3" http://localhost:8000/parse_media/audio
7.解析网页
curl -X POST -H "Content-Type: application/json" -d '{"url": "https://example.com"}' http://localhost:8000/parse_website
https://github.com/adithya-s-k/omniparse
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-12
2024-06-14
2024-08-06
2024-05-30
2024-06-17
2024-08-30
2024-11-28
2024-04-21
2024-10-16
2024-10-07