微信扫码
与创始人交个朋友
我要投稿
摘要
▌在 NebulaGraph 上构建应用风控图谱的成熟实践
在当今数据驱动的世界中,图数据库作为一种强大的数据结构,凭借其高效的查询性能和灵活的关联分析能力,正日益成为金融、风控等领域的核心技术之一。
在金融实时风控场景中,图数据库可以帮助实时监控和分析交易行为。以商户付款为例,当用户进行支付操作时,这个行为就形成了一个付款关系。在这种场景下,实时风控要求在用户付款的几秒钟内完成风险判定,并做出相应的处理决策。因此,对图数据库查询性能的要求极为高效,必须具备毫秒级响应能力。客户基于 NebulaGraph 构造了百亿级反欺诈图,以满足实时风控需求。
除了实时分析交易行为,还需要对已经落库的数据进行查询,图数据库可以实现实时查询与离线计算的融合。传统数据库中的数据通过 ETL 流程导入图数据库,进而可以执行更复杂的分析计算。例如,在进行社区检测等需要大量计算的任务时,图数据库能够高效处理异步操作和大规模数据计算。在图数据库中,我们可以执行更复杂的计算任务,如:
·社区检测: 通过分析客户之间的关系网络,检测潜在的虚假账户群体。
·路径分析: 通过分析用户行为路径,识别出不合规或异常行为模式。
·行为模式识别: 通过对用户行为的深入分析,识别出潜在的欺诈行为或恶意攻击模式。
在欺诈分析中,图数据库提供了强大的图指标分析能力。例如,在发卡风控场景中,通过分析申请人的单位、家庭、设备等维度的关联,图数据库能够构建一个业务知识图谱。该知识图谱不仅能够识别欺诈行为,还能够揭示异常的申请人模式。例如,某些账号可能存在相似的行为模式,或不同账号之间的关联性异常,这些都可以通过图算法识别出来。
平台分析模块中,提供了快速构建图谱规则和指标定义的能力,可以快速将各类业务逻辑进行转换,并基于规则对指标进行计算分析。
更进一步,图数据库还可以应用社区检测算法。通过客户关系、转账IP、设备号、联系电话等多个维度,将客户划分为多个社群,并计算各个社群之间的关联强度。通过这些社群指标,能够有效挖掘可疑个体,提升风控规则的覆盖率和准确性。
▌LLM基于图可以做什么?
1.Text to GQL
4.从非结构化数据到半结构化知识图谱
除了结构化数据,对于非结构化数据(如文本、图片、音频等),也可以提取成知识图谱的形式,再利用结构化查询的能力进行查询。
构建图谱类型可以按两个维度划分为四个区间,如上图所示。一个维度是领域特定型或通用型,领域特定指的是有明确的点边类型,而通用则是无明确类型,介于两者之间也有一些半结构化的类型,比如带有类型和属性,但主要信息在文本中。另一个维度是分析型或知识型,分析型是利用大模型生成 GQL 查询语句,获得结构化的查询结果;而知识型更注重总结查询结果的能力,以自然语言的形式给出总结报告。
在 NebulaGraph 中可以实现图谱的分层管理。如上图中所示,红色点为 Harry Potter 小说,黄色点是由小说切分出的 text 片段,绿色点是基于黄色点的片段中抽取出来的知识图谱,最后蓝色点是从知识图谱中获取的一些结构化的洞见。
▌NebulaGraphRAG 应用平台和开发者SDK
最后,介绍一下 NebulaGraphRAG 应用平台和开发者 SDK.
▌提问回答
前端集成LLM和Agent功能
· 问题:是否考虑将 LLM 或 Agent 功能集成到前端界面,如 explorer 工具中,以便提升用户体验。
· 回答:目前有可能实现这种集成,尤其是在 explorer 工具中,作为前端的一个载体,便于展示和使用 LLM 及 Agent 功能。
· 问题:GraphRAG 如何解决成本问题,特别是在与传统向量嵌入(Vector Embedding)方法的比较下,是否更具优势。
· 问题:构建多个社区报告时,如何避免频繁的 API 调用和数据更新带来的高成本。
· 回答:为了减少成本,可以采用“懒加载”策略,在真正需要时才生成社区报告。此外,对于数据更新所需的整个图重建问题,可以通过量化数据失效的程度来降低重建频率。例如,当图中的数据失效程度低于一定阈值时,可以容忍其不重建,降低系统负担。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-30
图数据库 VS 向量数据库?别选错了,真正的答案是这样!
2025-01-26
[2025论文解读]基于知识图谱的思考:一种知识增强的泛癌症问答大模型框架 - 中科院&广州国家实验室等
2025-01-23
使用大语言模型从零构建知识图谱(中)
2025-01-22
GraphRAG前沿进展:引入分而治之思想的KGRAG思路
2025-01-22
知识图谱与ai agent的演变
2025-01-21
央企实践案例展示:以AI带动产业,以应用引领技术
2025-01-18
LangGraph AI智能体如何通过知识图谱实现更强智能?以供应链管理系统为例
2025-01-14
向量数据库真的能满足所有 AI Agent 的记忆需求吗?
2025-01-02
2024-07-17
2025-01-03
2024-07-11
2024-08-13
2024-07-13
2024-06-24
2024-06-10
2024-07-12
2024-08-27
2025-01-14
2025-01-10
2025-01-06
2025-01-02
2024-12-16
2024-12-10
2024-12-04
2024-12-01