我要投稿

Triplex ：用于创建知识图谱的开源模型，成本比GPT-4o低10倍！

发布日期：2024-08-04 15:05:41 浏览次数： 2390 作者：活水智能

Triplex 是一款特别训练的三元组提取模型，可以将大量非结构化数据转化为结构化数据。

与 GPT-4o 相比，Triplex 在知识图谱构建方面性能更优，并且在零样本提示技术上表现更优，有效提升了知识图谱查询质量。而其成本却不到GPT-4o的十分之一。

Triplex 是开源的，可在 HuggingFace 和 ollama 上获取。

HuggingFace ：https://huggingface.co/SciPhi/Triplex

ollama：https://ollama.com/sciphi/triplex

图1：知识图谱结构示意图

知识图谱在回答传统搜索引擎难以处理的复杂查询方面表现出色，尤其是涉及群体关系的查询。

例如，“提供科技学校毕业的 AI 从业人员名单。”微软最近发布的 GraphRAG 论文进一步提升了人们对知识图谱的兴趣。

然而构建知识图谱的过程一直以来都非常复杂且耗费资源，限制了其推广。据估计，微软的 GraphRAG 方法成本特别高，每个输入标记需要生成至少一个输出标记。这种高成本使得大多数应用难以承受。

Triplex 旨在通过将知识图谱生成成本降低十倍来颠覆这一现状。Triplex 通过将非结构化文本转化为“语义三元组”来降低成本，这些三元组是知识图谱的基本单元。

以下是 Triplex 处理简单句子的示例：

城市：巴黎 > 首都 > 国家：法国

城市：巴黎 > 位于 > 国家：法国

以及更复杂的输入：

艺术家：梵高 > 属于 > 艺术流派：后印象派

作品：星夜 > 创作于 > 艺术家：梵高

艺术家：梵高 > 属于 > 艺术流派：表现主义

艺术家：梵高 > 属于 > 艺术流派：野兽派

性能

性能测试表明，Triplex 在成本和性能上都显著优于 GPT-4o。

准确性对比

价格对比

三元组提取模型的结果可与 GPT-4 相媲美，但成本却仅为其一小部分。这一显著的成本降低归功于 Triplex 的小型模型和无需少量示例上下文的能力。

在 SFT 模型的基础上，我们生成了更多基于偏好的数据集，通过多数投票和拓扑排序进一步使用 DPO 和 KTO 对 Triplex 进行训练。

这些额外的训练步骤显著提高了模型的性能。为了准确评估这些改进，我们使用 Claude-3.5 Sonnet 进行了严格评估。

评估中，我们对 Triplex-base、Triplex-kto 和 GPT-4o 进行了对比，结果如下表所示：

模型1	模型2	模型1胜	模型2胜	平局
triplex-base	gpt-4o	54%	43%	3%
triplex-kto	triplex-base	66%	26%	8%
triplex-kto	gpt-4o	56%	40%	4%

Triplex 的卓越性能源于其在多样且全面的数据集上的进行训练。

模型利用了来自 DBPedia 和 Wikidata 等权威来源的专有数据集，以及基于网络文本和合成生成的数据集。

数据集来源确保了 Triplex 在各种应用中的多功能性和稳健性。

使用

Triplex 还设计了 R2R RAG 引擎，结合 Neo4J 以立即利用 Triplex 进行本地知识图谱构建，这一用例因我们的工作而变得更加可行。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-28

DeepSeek本地部署（局域网+异地访问）数据库（保姆教程）

2025-04-28

milvus 三种部署方式说明

2025-04-28

使用CAMEL实现Graph RAG过程记录

2025-04-28

Graphiti-构建适用于 AI 智能体的实时知识图谱

2025-04-28

GraphRAG在企业知识服务中的应用落地

2025-04-27

知识图谱增强的合规医学大模型产学研新范式探索

2025-04-26

知识图谱

2025-04-26

面向产业链投研的智能知识图谱研究探索

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

喂饭教程！全网首发Neo4J可视化GraphRAG索引

2024-07-17

知识图谱+AI：如何构建一个Graph RAG App？

2025-01-02

全网首发！小白也能读懂的GraphRAG知识图谱全流程解析，多图预警！

2024-08-13

Knowledge Graph Studio：让知识图谱构建更简单、更智能

2025-01-03

十大向量数据库怎么选？AI/RAG应用开发技术参考

2024-08-27

手把手教你构建基于知识图谱的GraphRAG之结构化数据篇【LangChain+Neo4j】

2024-07-11

论文浅尝 | 揭开思维链、思维树和思维图的神秘面纱

2024-06-24

大语言模型和知识图谱结合的知识库（开篇）

2024-07-13

理解图结构和图推理，彻底掌握GraphRAG底层逻辑，悄悄超越99%的人 | ICLR2024

2024-07-12

两个基于大模型的知识图谱自动构建开源工具：兼看AutoKG轻量化关键词KG构建和混合增强问答思路

2024-06-10

大家都在问

LLM如何将杂乱文本变为可视化知识图谱？

2025-04-20

微软Phi-4-mini：小模型如何在GraphRAG中大放异彩？

2025-04-15

LLM知识图谱构建器：前端架构如何革新数据可视化？

2025-04-09

RAG知识库的数据方案：图数据库、向量数据库和知识图谱怎么选？

2025-03-29

DeepSeek+知识库，是智能体还是高级搜索引擎？

2025-02-13

向量数据库真的能满足所有 AI Agent 的记忆需求吗？

2025-01-14

如何用GraphRAG + GNN解锁知识图谱的隐藏价值？

2025-01-10

搭建一个本地AI知识库需要用到哪些技术栈？

2025-01-06

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

Triplex ：用于创建知识图谱的开源模型，成本比GPT-4o低10倍！

准确性对比

价格对比

使 用

使用