AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


盘点已问世的中医药大语言模型
发布日期:2024-10-16 07:21:26 浏览次数: 1575 来源:天然药物发现和计算药物设计



中医药是中国传统科学的瑰宝,传承创新发展中医药是新时代中国特色社会主义事业的重要内容。现如今,为推动中医药的现代化、智能化发展,多个中医药大模型已经问世。随着大语言模型技术的蓬勃发展,中医药学迎来了数字化和智能化转型的新机遇。在此,与大家一起盘点已公开的中医药大语言模型。


表1.中医药大语言模型汇总


首个中医药大语言模型—‘‘仲景’’


‘‘仲景’’是受古代中医学巨匠张仲景深邃智慧启迪,专为传统中医领域打造的预训练大语言模型。由复旦大学张文强教授、王壟博士后等人共同指导。


图1.由Bing画图输出与人类提示相结合生成的CMLM-ZhongJing的Logo


此项目开源了针对Qwen1.5-1.8B-Chat模型的微调权重,在一张Tesla T4显卡即可实现高速推理。通过在专有医疗数据集上进行多次迭代训练确保模型在中医药领域具备较强理解和生成能力。此外,‘‘仲景’’借鉴人类记忆知识的过程,采用专业表格,借助大语言模型的语言表征能力,严格设置特定的prompt模板,使得模型基于中医妇科方药表格数据生成包括患者治疗故事、诊断分析、诊断治疗预期结果、处方功用、互动故事、患者治疗故事、叙事医学、舌脉象、诊疗方案制定、批判性思维、随访、处方、药物用量、个例研究、真实世界问题、病因病机等15个场景,以促进模型对中医方药数据及诊断思维逻辑的推理能力。


图2.人类医生参与的多任务治疗行为分解指令构建策略。


‘‘仲景’’旨在阐明中医博大精深之知识,传承古代智慧与现代技术创新,最终为医学领域提供可信赖和专业的工具。https://github.com/pariskang/CMLM-ZhongJing


‘‘海河·岐伯’’


2024年1月,天大智图(天津)科技有限公司的中医药大语言模型——“海河·岐伯”大模型开放内测。


“海河·岐伯”大模型的命名源于“医术之祖”——《皇帝内经》,该大模型系统以中医典籍为核心,抽取四库全书医家类资料、传统中医文献与权威中医药学资料的文本素材,以中医药领域的基本概念、知识、理论、疾病、药物、方剂等为节点,形成完整的知识图谱。“海河·岐伯”通过大模型真实还原古医书中记载的崎伯问诊场景,为现代中医药学提供了新一代大语言模型。


图3.构建Qibo的总体流程图.


作为面向中医药领域的大模型,“海河·岐伯”为传统行业的数智化转型和信息化发展赋能。


‘‘数智岐黄’’


2024年3月,华东师范大学举办的 “AI 赋能下的未来药学产学研发展论坛” 大会上发布了“数智岐黄”中医药大模型。该模型是由华东师范大学、 上海中医药大学、华理工大学、海军军医大学等多家单位及全国重点实验室联合开发。


“数智岐黄”中医药大模型以《黄帝内经》《伤寒杂病论》等中医典籍及1000多本古籍和中医药文献为核心数据基础,以高质量中医药知识图谱为知识库,涵盖超过8万种方剂、超过2000种症候、超过9000种中药材、超过4万种中药成分、超过1.8万种靶点、超过2000种疾病,采用预训练和微调并结合检索增强生成和插件调用等技术,通过方剂推荐、中药性质解读、症候辅助诊断,实现中医药领域知识智能问答、健康咨询、中医药知识图谱动态交互三大核心功能,助力中医药创新研究和人才培养、临床辅助诊疗和中医养生保健,推动中医药文化传承创新发展。


‘‘数智本草’’


在2024年5月召开的数智赋能大健康产业新质生产力暨第四中医药国际发展论坛上,天士力医药发布了《数智中药——现代中药的数智化发展白皮书》,紧接着重磅推出了聚焦中药产业创新研发的“数智本草”大模型。“数智本草”大模型,是基于华为澎湃算力与向量库等先进工具,由天士力与华为云在华为盘古大语言模型和盘古药物分子大模型的基础上联合开发的中医药语言大模型和计算大模型。


目前大模型集守正(1000种以上古籍及翻译,9万首以上方剂,4万个以上中成药等)、创新(4000万份以上文献摘要,300万种以上天然产物,2万个以上靶基因通路信息等)、产业化(10万个以上临床方案,16万个以上中药专利以及药典政策指南等)三大类海量数据。“数智本草”语言大模型,拥有380亿参数量,基于中医药海量文本数据预训练,结合向量库检索强化,以及中药研发多场景的微调,能够更好地帮助研究者完成中医药理论证据的挖掘和总结。

https://tcmaidd.tasly.com/ui/#/login


TCMLLM


TCMLLM北京交通大学计算机与信息技术学院医学智能团队开发的中医药大语言模型项目,旨在通过大模型方式实现中医临床辅助诊疗(病证诊断、处方推荐等)中医药知识问答等任务,推动中医知识问答、临床辅助诊疗等领域的快速发展。目前针对中医临床智能诊疗问题中的处方推荐任务,发布了中医处方推荐指令微调大模型TCMLLM-PR。研发团队整合了8个数据来源,涵盖4本中医经典教科书《中医内科学》、《中医外科学》、《中医妇科学》和《中医儿科学》、2020版中国药典、中医临床经典医案数据、以及多个三甲医院的涵盖肺病、中风病、糖尿病、肝病、脾胃病等多病种的临床病历数据,构建了包含68k数据条目(共10M token)的处方推荐指令微调数据集,并使用此数据集,在ChatGLM大模型上进行大规模指令微调,最终得到了中医处方推荐大模型TCMLLM-PR。https://github.com/2020MEAI/TCMLLM


图4.统计信息


ShenNong-TCM-LLM


ShenNong-TCM华东师范大学团队完成,旨在推动LLM在中医药领域的发展和落地,提升LLM的在中医药方面的知识与回答医学咨询的能力,同时推动大模型赋能中医药传承。



该项目在2023年6月开源了中文中医药大模型——ShenNong-TCM,模型是以LlaMA为底座,采用LoRA (rank=16)微调得到。ShenNong-TCM以中医药知识图谱为基础,采用以实体为中心的自指令方法entity-centric self-instruct,调用ChatGPT得到11w+的围绕中医药的指令数据。

https://github.com/michael-wzhu/ShenNong-TCM-LLM


‘‘Huang-Di’’


黄帝源自中医古籍《黄帝内经》,由南京大学信息管理学院及郑州大学人工智能学院合作完成。在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材数据:收集“十三五”规划所有中医教材共22本;在线中医网站数据:爬取中医世家、民间医学网等在线中医网站及知识库。训练出一个具有中医知识理解力的预训练语言模型(pre-trained model),之后在此基础上通过海量的中医古籍指令对话数据及通用指令数据进行有监督微调(SFT),使得模型具备中医古籍知识问答能力。

https://github.com/Zlasejd/HuangDI

图5.Huang-Di模型应用示例


‘‘本草智库’’——中医药大模型


2024年4月12日,由成都中医药大学北京百度网讯科技有限公司太极集团有限公司天府中药城等单位联合开发的全球首个中药全产业链大模型——本草智库在第二届“千种本草基因组计划”研讨会上发布。


本草智库大模型基于中国工程院院士、成都中医药大学首席教授陈士林团队本草基因组学的研究成果构建。本草智库汇集了1500万条中药材基原物种基因信息、3000余万条中药成分与靶点互作信息、400余万个化合物等中药研究底层核心数据,形成了覆盖中药全产业链的2000余万个实体和超20亿个关系对知识图谱,让中药材有了专属“基因身份证”。


该模型以千亿级参数规模文心大模型为支撑,通过指令微调和检索增强生成技术,具备中药知识提取与生成、中药垂直领域解决方案输出、中药产业一站式数字化服务三大功能,实现了中药研究底层核心数据与中药全产业链关键环节有机结合。这一模型有助于提升中药基础研究和产业整体效率及质量水平,可为中药全产业链各关键环节提供精准决策支持,从而优化生产流程,提高产品质量,确保药品安全


图6.本草智库·中医药大模型发布会


‘‘盘古’’大模型


华为中医药大模型于2024年1月23日正式亮相。浙江九为健康科技股份有限公司华为云计算技术有限公司在华为深圳总部签署了中医药大模型全面深化合作协议,共同推出了这一创新性的中医药大模型。该模型的出现标志着传统中医药与现代科技的深度融合,为中医药领域的研究、开发和应用提供了新的思路和方法。


盘古中医药大模型是一个基于深度学习技术的大规模预训练模型,专门针对中医药领域进行设计和优化。该模型利用海量的中医药数据进行训练,能够深入理解中医药的语言和文化,为中医药的研究、开发和应用提供了强大的支持。


在数据方面,盘古中医药大模型融合了中医经典文献、中药方剂、药材信息、临床案例等多种类型的数据,形成了一个庞大而全面的中医药知识库。这些数据不仅涵盖了中医药的各个方面,还经过了精心的清洗和标注,确保了数据的质量和准确性。


在技术方面,盘古中医药大模型采用了深度学习中的Transformer架构,这是一种具有强大特征提取和上下文理解能力的神经网络结构。通过大规模的预训练,该模型能够自动学习到中医药领域的复杂知识和模式,为后续的应用提供了坚实的基础。


在应用方面,盘古中医药大模型展现出了广阔的前景和潜力。首先,在中药方剂推荐方面,该模型能够根据患者的症状和体质,智能推荐个性化的中药方剂,提高了中医治疗的精准度和效果。其次,在药材质量控制方面,该模型能够通过对药材的性状、产地、采收时间等信息的分析,辅助鉴别药材的真伪和优劣,确保了药材的质量和安全。此外,在病症辅助诊断、新药研发以及健康管理等方面,华为中医药大模型也都能够发挥重要的作用。


盘古中医药大模型的出现,不仅对中医药领域产生了深远的影响,也为传统医学与现代科技的融合提供了新的思路和方法。通过该模型的应用,我们能够更加深入地理解中医药的精髓和智慧,推动中医药的现代化和国际化进程。同时,该模型也为其他传统医学领域与现代科技的融合提供了有益的借鉴和参考。


图7.‘‘九为’’‘‘华为’’‘‘联手构建’’盘古中医药大模型


‘‘华佗’’中医药大模型


亳州,中国药都,华佗是东汉末年的杰出医学家,其故乡正是现在的亳州市,此次亳州与华为公司合作建设华佗中医药大模型。亳州市与华为公司强强联合,充分利用华为算力、算法优势,亳州中医药政策、区域、资源、数据优势,打造首个中医药产业大模型——华佗中医药大模型。


根据《华佗中医药大模型建设方案》,亳州市将构建全球首个中医药产业大模型,落实国家人工智能+行业战略目标,赋能中医药行业提质增效。建设华佗中医药大模型创新中心,打造世界中医药之都、全国中医药产业高地、中医药进入国际市场的“桥头堡”。


《华佗中医药大模型建设方案》明确:以华佗中医药大模型创新中心、产业交易平台、产业数据平台、产业大模型服务平台等“一中心三平台”构建华佗中医药产业大模型,整合中医药产业资源。围绕生产、贸易、服务、管理,以新产业、新模式、新动能为核心完善产业布局,汇聚亳州中医药数据,明确中药、中医价值场景和需求,持续发展“人工智能+”融合新业态,推动亳州中医药产业的创新和升级。


‘‘岐黄问道’’中医药大模型


2023年7月28日下午,由国内数智中医行业的领军企业南京大经中医药信息技术有限公司研发的“岐黄问道·大模型”在南京江北新区产业技术研创园隆重发布。来自医疗界、技术界、投资界、中医药与大健康产业界以及包括新华社、人民日报在内的新闻界的约100位嘉宾出席了发布会。


岐黄问道大模型是一个基于中医知识和数据的人工智能模型,由大经中医研发和发布。它可以根据用户提供的疾病、症状、体征等信息,给出中医的诊断和治疗方案,包括中药、食疗、茶饮、推拿、艾灸等多维度的养生调理建议。它的目的是实现中医临床诊疗和健康养生的智能化,传承和发展中医药文化。


岐黄问道大模型包括三个方向的子模型

1.基于已确诊疾病的临床诊疗大模型;

2.仅仅基于症状、体征的临床诊疗大模型;

3.中医养生调理大模型。


岐黄问道大模型是国内首个以中医为核心的垂直领域大模型,也是年轻人养生的第一个大模型。它有助于中医药数智化发展,也有助于普及中医药知识和服务,提高人们的健康水平和生活质量。


图8.岐黄问道·大模型


‘‘讯飞星火’’中医药大模型


2024年6月27日,科大讯飞正式对外发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。


随着新版本的发布,讯飞星火V4.0七大核心能力全面升级,在8个国际主流测试集中排名第一,整体超越GPT-4 Turbo,领先国内大模型。现场刘庆峰分享的数据显示,在海量知识问答、复杂语言理解、专业文书生成、诊断治疗推荐、多轮交互以及多模态交互等方面,讯飞星火医疗核心能力全面超过GPT-4 TurboGPT-4o


刘庆峰称,当前,星火APP下载量已经达到了1.31亿,涌现出一批用户喜爱的应用助手。在星火大模型的加持下,部分场景下的智能硬件销量同比增长70%+,月均使用时次数超过4000万。另外,星火V4.0大模型是基于全国首个国产万卡算力集群「飞星一号」训练而成,意味着完全自主可控。


图9.讯飞星火中医大模型


‘‘聪宝素问’’大模型


2023年8月12日,全国首个公开发布的中医GPT—“聪宝素问”,在第九届中国中医药信息大会上正式上线2.0版本。


“聪宝素问2.0”由聪宝科技创始人顾高生发布,中国中医药信息学会会长、国家中医药管理局原副局长吴刚,中国中医药信息学会副会长兼执行秘书长朱佳卿,华润数科华润云事业部行业生态部专家邓通参与发布仪式。


而中医奠基之作《黄帝内经》的成书体裁,与GPT有着惊人的相似之处:整本书是以问题为牵引,通过黄帝和岐伯的对话来解析中医。黄帝就是“提示词工程师”,与岐伯“连续对话”,产生“生成式内容”。

《黄帝内经》《素问》《灵枢》两卷组成,起名为“聪宝素问”,印证了这段跨越千年的机缘。


目前,“素问 GPT”已正式进入临床应用阶段,可广泛应用于康养机构、药店诊所、文旅养生,药膳餐饮等众多领域,形成对应的服务解决方案。未来,“素问GPT”还将开放更多应用场景,并提供新场景的订制服务。


图10.聪宝GPT首页


‘‘天河灵枢’’大模型



2024年4月10日,在第三届中医药高质量发展大会暨新时代中医药高质量发展战略研讨会上,由国家超级计算天津中心联合现代中医药海河实验室天津中医药大学天津大学、信创海河实验室等团队合作研发的“天河灵枢大模型”装置正式发布。‘‘天河灵枢大模型”的命名来源于中国传统医学著作《灵枢》,与《素问》九卷合称《黄帝内经》。“天河灵枢大模型”是基于中医经典名著针灸临床循证证据库以及中医循证知识图谱等专业数据,这是一款面向中医针灸领域的专业大模型。


“天河灵枢大模型”学习了上百本中医经典,经过上万篇循证证据训练,具备深厚的中医理论知识,可作为中医智慧助手为用户提供精准且专业的解答。无论是对中医理论的深入探讨,还是对健康问题的细致剖析,“天河灵枢大模型”均能迅速给出详尽且深入的回应。当用户寻求针灸治疗建议时,“天河灵枢大模型”能够迅速分析用户的病情,提出包括针刺、艾灸、按压等多种针灸治疗方法的个性化建议。


图11.‘‘天河灵枢’’大模型


中医药横琴大模型


2023年12月28日,中医药广东省实验室第一届学术委员会第一次会议暨首届横琴中医药科技创新大会在横琴粤澳深度合作区举行。会上,正式启动了中医药横琴大模型和中药新药智能自动化融合创新平台。


据介绍,中医药横琴大模型汇集海量中医药数据,包含100亿字符的中医知识文本以及中医院的数字化病例,依托高可信中医诊疗知识库,辅助医生精准诊疗,提供个性化治疗方案。中药新药智能自动化融合创新平台通过工程化开发,基于机器人与自动化技术实现中药成分获取、结构表征、生物活性测定等全实验流程一站式解决方案。



图12.中医药横琴大模型




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询