微信扫码
与创始人交个朋友
我要投稿
LlamaParse[1] 是一个专为生成式人工智能(GenAI)设计的文档解析器,能够解析复杂的文档数据,以适应任何下游大型语言模型(LLM)的使用场景,如检索增强生成(RAG)或智能代理。
它能够解析多种复杂的文件类型,包括 PDF、PPTX、DOCX、XLSX 和 HTML,并且支持表格识别、多模态解析和自定义解析。
pip install llama-parse
命令安装 LlamaParse 包。import nest_asyncio
nest_asyncio.apply()
from llama_parse import LlamaParse
parser = LlamaParse(
api_key="llx-...", # 也可以设置环境变量 LLAMA_CLOUD_API_KEY
result_type="markdown", # 可选 "markdown" 和 "text"
num_workers=4, # 如果上传多个文件,将分成 `num_workers` 个 API 调用
verbose=True,
language="en", # 可选定义语言,默认为英文
)
# 同步解析单个文件
documents = parser.load_data("./my_file.pdf")
# 同步批量解析
documents = parser.load_data(["./my_file1.pdf", "./my_file2.pdf"])
# 异步解析单个文件
documents = await parser.aload_data("./my_file.pdf")
# 异步批量解析
documents = await parser.aload_data(["./my_file1.pdf", "./my_file2.pdf"])
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
欢迎关注&点赞&在看,感谢你的阅读~
Github地址: https://github.com/run-llama/llama_parse
[2]LlamaIndex Cloud: https://cloud.llamaindex.ai/api-key
[3]LlamaParse 官方文档: https://docs.cloud.llamaindex.ai/
[4]LlamaIndex 官方文档: https://docs.llamaindex.ai/en/stable/module_guides/loading/simpledirectoryreader.html
[5]LlamaIndex 官网: https://www.llamaindex.ai/contact
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-10-03
RAG实战篇:将用户输入转换为精确的数据库查询语言
2024-10-02
RAG(检索增强生成)新探索:IdentityRAG 提高 RAG 准确性
2024-10-01
你的RAG混合搜索效果不好?别着急上Reranking,先把RRF算法的K=60改了试试。
2024-10-01
LLM RAG面试问题大全!
2024-10-01
检索增强生成(RAG)与相关技术综述:问题、分类、数据、模型、挑战
2024-10-01
大模型RAG:基于PgSql的向量检索
2024-09-30
RAG实战篇:精准判断用户查询意图,自动选择最佳处理方案
2024-09-30
【RAG】HiQA:一种用于多文档问答的层次化上下文增强RAG
2024-07-18
2024-07-09
2024-07-09
2024-07-08
2024-06-20
2024-07-09
2024-05-05
2024-07-07
2024-07-07
2024-05-19
2024-09-30
2024-09-26
2024-09-26
2024-09-20
2024-09-16
2024-09-12
2024-09-11
2024-09-10