微信扫码
与创始人交个朋友
我要投稿
背景
知识图谱构建流程图 Step1:准备样本数据 将经过数据预处理的 1081 条医案数据作为样本数据。 Step2:定义抽取目标 根据定义的本体构建的知识图谱模式层设定抽取目标,如疾病、相关疾病、症状、检查、舌象、脉象、配伍等关键信息,针对抽取目标类型,只能定抽取规则。 Step3:自动抽取知识 根据定义的抽取目标制定 Prompt 提示模板,采用“示范案例+关系列表”的提示模板引导大语言模型对医案数据进行自动化抽取,生成三元组。 以下是一个具体的 Prompt 示例: “假如你是一个中医的关系抽取大语言模型,对鼻炎患者的症状和相关疾病进行关系抽取,抽取医案示范:“鼻炎近来密帘三天,弊病当然发作,涕多,涕难擤。头痛。鼻塞。鼻粘膜水肿,有分泌物。舌薄苔,脉浮紧。桑叶6g,薄荷6g,桔梗6g,石菖蒲6g,路路通10g,荆芥6g,白芷6g,苍耳子10g,金荞麦10g,蔓荆子10g。”。输出格式为[(“鼻炎”,“症状”,“涕多”),(“鼻炎”,“症状”,“涕难擤”),(“鼻炎”,“症状”,“头痛”),(“鼻炎”,“症状”,“鼻塞”),(“鼻炎”,“检查”,“鼻粘膜水肿”),(“鼻炎”,“检查”,“有分泌物”),(“鼻炎”,“舌象”,“舌薄苔”),(“鼻炎”,“脉象”,“脉浮紧”),(“鼻炎”“配伍”,“石菖蒲6g”),(“鼻炎”,“配伍”,“路路通10g”),(“鼻炎”,“配伍”,“荆芥6g”),(“鼻炎”,“配伍”,“白芷6g”),(“鼻炎”,“配伍”,“苍耳子10g”),(“鼻炎”,“配伍”,“金荞麦10g”),(“鼻炎”,“配伍”,“蔓荆子10g”)],学习上述抽取格式,抽取下列病案,以三元组格式输出,给定的句子为:“***”。给定关系列表:[‘症状’, ‘相关疾病’, ‘配伍’, ‘舌象’, ‘检查’, ‘脉象’],请给出关系列表中的关系。如果不存在则输出:无。 Step4:清洗抽取结果 利用正则表达式对自动化抽取生成的三元组数据进行清洗,去除错误、冗余、不相关和不完整的三元组,确保数据的准确性和可靠性。 Step5:存储三元组 将最终获取到的三元组数据存储到 NebulaGraph 数据库中。 在利用大语言模型抽取知识的过程中,为了保证其可靠性,本文直接将疾病和中药抽取成对应的三元组,在写入知识图谱的过程中进一步分解,保证图谱的合理性。同时在利用大语言模型抽取知识的过程中将中药实体及属性联合抽取,如某一个鼻炎患者的处方中,金荞麦的剂量10g抽取为(“鼻炎”,“配伍”,“金荞麦10g”)。本文在存储三元组之前,利用正则表达式对实体和对应属性进一步抽取。例如(“鼻炎”,“配伍”,“金荞麦10g”)抽取为(“鼻炎”,“配伍”,“金荞麦”)和(“金荞麦”,“剂量”,“10g”),在下文中具体展示构建的知识图谱。 利用 NebulaGraph 构建知识图谱 实验if relation'=="配伍”:
判断·三元组中的中药是否包含剂量单位属性,有的话,进行属性抽取,将抽取结果写入图谱。
Else:
直接写入图谱。
end for
知识图谱展示
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-07-17
2024-07-11
2024-08-13
2024-07-13
2024-07-12
2024-06-24
2024-07-08
2024-06-10
2024-07-26
2024-08-27
2024-12-16
2024-12-10
2024-12-04
2024-12-01
2024-11-30
2024-11-22
2024-11-04
2024-10-10