微信扫码
添加专属顾问
我要投稿
大家好!在本篇博客中,我将带领大家了解知识图谱以及如何利用大模型和您自己的文本数据构建一个知识图谱。
知识图谱,也被称为语义图,是一种智能结构,以高效的方式存储数据。
数据以节点和边的形式存储。如下图所示,节点代表对象,边表示它们之间的关系。知识图谱所代表的数据模型有时被称为资源描述框架(RDF)。RDF定义了在万维网中相互链接站点的方式。
在整个数据故事中,只有少数数据点是内在的,可以代表整个数据集。因此,知识图谱仅存储重要的数据点。这显著降低了检索时间复杂度,并减少了空间复杂度。
pip install -q langchain openai pyvis gradio==3.39.0
导入已安装的包:
from langchain.prompts import PromptTemplate
from langchain.llms.openai import OpenAI
from langchain.chains import LLMChain
from langchain.graphs.networkx_graph import KG_TRIPLE_DELIMITER
from pprint import pprint
from pyvis.network import Network
import networkx as nx
import gradio as gr
从 Open AI 平台仪表板复制 API 密钥,并设置 API 密钥环境变量。
from google.colab import userdata
OPENAI_API_KEY = userdata.get('OPENAI_API_KEY')
定义用于知识三元提取的提示模板。
使用描述性提示,使用 LLMChain 类初始化链。
llm = OpenAI(
api_key=OPENAI_API_KEY,
temperature=0.9
)
# 使用知识三元提取提示创建 LLMChain
chain = LLMChain(llm=llm, prompt=KNOWLEDGE_TRIPLE_EXTRACTION_PROMPT)
从字符串输入加载文本数据,并通过用户定义的函数解析检索到的三元组。
使用 PyVis 创建精美的可视化效果,并使用 Gradio 框架交互地显示它。
在此过程中,我们使用了一些用户定义的函数来简化任务。
最后,我们通过 Gradio 显示 PyVis 生成的 HTML。
通过简单地将 share=True
添加到 demo.launch(share=True)
方法中,您可以使应用对任何人可见。
这样,我们就通过 Gradio 框架展示了我们的知识图谱,使页面可以轻松与任何在线用户共享链接。
注意:您可以通过使用更高级的LLMs来提高性能。
(完)
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-31
从Milvus Operator聊聊,手动运维终将被淘汰
2025-03-30
大模型+知识图谱:重塑企业制度标准管理
2025-03-30
解锁LLM知识库检索:高返回率背后的关键密码
2025-03-29
RAG知识库的数据方案:图数据库、向量数据库和知识图谱怎么选?
2025-03-28
知识图谱落地难,大道至简,二八定律——RAG+Agent
2025-03-26
向量数据库概述
2025-03-26
010:通过 MCP PostgreSQL 安全访问数据
2025-03-25
斯坦福最新KGGEN,用LLM从纯文本中提取知识图,采用DSPy超出GraphRAG精度18.27%
2025-01-02
2024-07-17
2024-08-13
2025-01-03
2024-07-11
2024-06-24
2024-08-27
2024-07-13
2024-07-12
2024-06-10
2025-03-29
2025-02-13
2025-01-14
2025-01-10
2025-01-06
2025-01-02
2024-12-16
2024-12-10