我要投稿

LlamaIndex ，10分钟快速构建基于本地 Markdown 文件的 QA 问答知识库工具

发布日期：2024-04-12 23:05:05 浏览次数： 3065

作者：牛爷儿

微信搜一搜，关注“牛爷儿”

引言

LlamaIndex，将企业数据转化为生产级别的 LLM 应用。它具有以下主要特点：

数据集成：支持 160 多种数据源，包括非结构化、半结构化和结构化数据。可以无缝地将各种数据源集成到 LLM 应用中
索引：存储和索引数据，以满足不同的使用场景。LlamaIndex 可以与 40 多种向量存储、文档存储、图形存储和 SQL 数据库进行集成
查询：编排从prompt chain，RAG，agent的工作流
评估：提供全面的模块套件，用于评估 LLM 应用的性能

实现方式

我们基于本地Obisidian笔记软件，构建一个私有的QA知识库。Obsidian是一款markdown笔记软件，markdown文件完全本地化，完全自主可控。

# 安装依赖pip install llama_index pyvis
# 导入包from llama_index import ( ObsidianReader, # 这个太赞了，可直接读obsidian文件 LLMPredictor, ServiceContext, KnowledgeGraphIndex,)
from llama_index.graph_stores import SimpleGraphStorefrom llama_index.storage.storage_context import StorageContextfrom llama_index.llms import OpenAI
filepath = '/path/to/your/obsidian/vault'
# 初始化contextuse_context = { "temperature": 0, "model": "选择一个model，huggingface上找一个就行", "chunk_size": 512}
documents = ObsidianReader(filepath).load_data()llm = OpenAI(temperature=use_context['temperature'], model=use_context['model'])service_context = ServiceContext.from_defaults(llm=llm,  chunk_size=use_context['chunk_size'])
graph_store = SimpleGraphStore()storage_context = StorageContext.from_defaults(graph_store=graph_store)
# 构建知识图谱indexindex = KnowledgeGraphIndex.from_documents( documents=documents, max_triplets_per_chunk=2, storage_context=storage_context, service_context=service_context, include_embeddings=True,)
# 搞定，你可以实验一下跑的结果query = "写一段提示词，可以跟你本地的markdown文件内容相关的问题"query_engine = index.as_query_engine( include_text=True, response_mode="tree_summarize", embedding_mode="hybrid", similarity_top_k=5,)
response = query_engine.query(query)

以上是一个简单的实现示例，实际应用中，可能需要根据情况进行调整和优化。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-31

Opera One升级内置AI 迎来智能助手新纪元

2025-10-31

LangExtract——大模型文本提炼工具

2025-10-31

用户测评｜DeepSeek-OCR，你用了吗？

2025-10-31

从Palantir智能化技术路线看AI时代企业级架构平台的核心战略位置

2025-10-31

OpenAI 公开 Atlas 架构：为 Agent 重新发明浏览器

2025-10-31

Palantir 本体论模式：重塑企业 AI 应用的 “语义根基” 与产业启示

2025-10-31

树莓派这种“玩具级”设备，真能跑大模型吗？

2025-10-30

Cursor 2.0的一些有趣的新特性

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

DeepSeek突然更新V3.1：实测后才发现的亮点与槽点

2025-08-19

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

DeepSeek v3.1 到底有多强？与 Claude Code 一起实测！

2025-08-20

大家都在问

用户测评｜DeepSeek-OCR，你用了吗？

2025-10-31

树莓派这种“玩具级”设备，真能跑大模型吗？

2025-10-31

大模型的Funcation Calling是什么？

2025-10-29

向量搜索已过时，混合搜索都有三大流派了！你看好哪个流派？

2025-10-29

BCG最新报告：企业如何跨越AI价值鸿沟，进入复利增长？

2025-10-28

如何用飞书多维表格快速搭建一个可落地应用？

2025-10-28

当AI学会“听”：声音识别到声音理解，AI到底是怎么听懂的？

2025-10-27

如何让你的内容出现在AI生成的答案中？

2025-10-26

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部