AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


手搓KIMI的机会来了!蚂蚁首个Graph RAG 框架开源啦!
发布日期:2024-07-15 10:43:05 浏览次数: 3226 来源:人本智能


著名的检索增强生成应用kimi,估值已经达到了180亿美元。

现在,你也有机会手搓一个属于自己的kimi啦!

KIMI走的是检索增强生成路线,简称RAG:Retrieval Augmented Generation,它就是把信息检索与大模型结合,以缓解大模型推理“幻觉”的问题。


RAG的目标是通过知识库增强内容生成的质量,通常做法是将检索出来的文档作为提示词的上下文,一并提供给大模型让其生成更可靠的答案。更进一步地,RAG的整体链路还可以与提示词工程(Prompt Engineering)、模型微调(Fine Tuning)、知识图谱(Knowledge Graph)等技术结合,构成更广义的RAG问答链路。

但是呢,它也会有一些其他问题,比如

知识库内容缺失,截断有用文档,上下文整合丢失,有用信息未识别,提示词格式问题,准确性不足,答案不完整

比如,最经典的RAG架构,首先是索引,就是向量嵌入,然后是检索,进行相似查询,最后是生成文档上下文

除了传统意义上的增强内容生成,RAG的理念还可以做很多事情,比如:增强训练,增强微调,增强语料,增强知识,增强检索,增强推理
类似地,Graph RAG的核心链路也分如下三个阶段:
第一是索引,通过LLM服务实现文档的三元组提取,写入图数据库。
第二是检索:通过LLM服务实现查询的关键词提取和泛化(大小写、别称、同义词等),并基于关键词实现子图遍历(DFS/BFS),搜索N跳以内的局部子图。
第三是生成:将局部子图数据格式化为文本,作为上下文和问题一起提交给大模型处理。
开源的AI工程框架有诸多选型:LangChain、LlamaIndex、RAGFlow、DB-GPT等。知识图谱系统有:Jena、RDF4J、Oxigraph、OpenSPG等。图存储系统有Neo4j、JanusGraph、NebulaGraph、TuGraph等。
而作为蚂蚁首个对外开源的Graph RAG框架所有环节均采用蚂蚁全自主的开源产品:DB-GPT + OpenSPG + TuGraph。一个可以支持RAG的AI工程框架,一个知识图谱系统和一个图存储系统。

有兴趣的小伙伴,快去看一下吧!




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询