微信扫码
与创始人交个朋友
我要投稿
随着科技的快速发展,人工智能已经在诸多领域展现出了强大的潜力和价值,尤其在金融行业中,AI技术的应用日益广泛。然而,传统的人工智能模型如深度学习等由于其“黑箱”性质,往往无法为决策过程提供清晰、透明的解释,这在对决策结果需要高度负责的金融领域中,形成了一定程度的制约。因此,近年来,“可解释人工智能(Explainable Artificial Intelligence,XAI)”这一概念应运而生,旨在构建能提供决策依据、逻辑透明的人工智能系统。
目前有很多关于人工智能模型可解释性的研究方法,从方法的不同角度出发可归纳为基于模型相关性、模型的解释时机和解释范围。其中,基于模型相关性包括模型无关的解释方法和依赖于模型的解释方法。模型无关的解释方法主要关注模型的输入和输出,依赖于模型的解释方法关注模型的内部参数和结构。本文针对可解释性方法进行综述,同时探讨了可解释AI在金融行业中的具体应用场景。
一、背景
数据科学家为业务提供解决方案时,通常涉及模型的构建,从专家规则到线性模型和决策树再到集成算法和深度学习,研究和使用的模型越来越复杂。尽管这些新方法有时提供更为精确的结果,但由此构建的人工智能系统却变得错综复杂,模型的透明度逐渐降低。对于使用者而言,某些机器学习模型尤其是深度神经网络如同黑箱一般,给它一个输入,反馈一个决策结果,没人能确切地知道模型背后的决策依据以及它做出的决策是否可靠。而缺乏可解释性将有可能给实际任务尤其是安全敏感的领域带来严重的威胁。如在客户评级、信用风险预测、反欺诈、反洗钱、客户画像等典型金融场景中,AI模型的可解释性显得尤为重要。要解决这一问题,需要打开黑箱模型,可解释人工智能(Explainable Artificial Intelligence,XAI)就是理解 AI 模型的有效技术。
可解释AI
XAI是指人类可以理解人工智能做出的决策,旨在克服传统“黑箱”机器学习模型的不透明性问题,使得决策过程对于终端用户、开发者、监管机构以及其他利益相关方来说是可以解释和验证的。这不仅有助于建立用户对AI系统的信任,也有利于满足伦理、法规和社会责任的要求。我国于 2022 年提出了“可解释、可通用的下一代人工智能方法”重大研究计划,旨在打破现有深度学习“黑箱算法”的现状,建立一套可适用于不同领域、不同场景(语音、图像、视频等)的通用方法体系。可解释AI的工作流程如图1所示。
图1 可解释AI的工作流程
重要性
在金融行业这个高度敏感且受到严格监管的领域,涉及到大量复杂业务场景和客户数据,可解释AI的应用不仅能确保决策过程的合法合规,而且有助于提高业务流程的透明度,促进社会信任和公平正义,同时也极大地推动了金融机构智能化升级的进程。其重要性主要体现在以下几个方面:
(1)风险控制与合规监管
风险评估是金融行业的核心环节,金融机构在信贷审批、保险承保、投资决策等过程中依赖于精准的风险预测模型。传统的黑箱模型虽然可能在精度上表现优异,但无法说明其决策依据,这使得监管机构难以核查其是否符合法规要求和风险管理原则。而可解释AI能够提供决策背后的逻辑和关键变量影响程度,帮助满足严格的监管审查。
(2)决策透明度与信任构建
客户和利益相关者对于自动化决策的信任至关重要。可解释AI能够为复杂的金融决策过程提供清晰、易于理解的解释,从而增强客户对金融机构的信心,并减少因算法误判导致的法律纠纷和社会争议。
(3)防止歧视与公平性维护
金融行业中必须避免任何形式的不公平对待或歧视。可解释AI有助于发现并纠正潜在的偏见,确保信贷、保险和其他金融服务不会基于性别、种族、年龄等因素做出不公正的决定。
(4)问题定位与模型优化
当模型出现错误时,可解释性有助于快速定位问题所在,分析是数据偏差还是模型缺陷造成的,并据此调整策略和优化模型性能。
(5)业务洞察与战略制定
可解释AI不仅揭示了单一决策的过程,还提供了关于市场趋势、客户行为模式及潜在风险因素的深入洞察,有利于金融机构制定更明智的战略决策和产品设计。
二、可解释性方法
分类
Christoph Molnar在他的《Interpretable Machine Learning, Making Guide for Making Black Box Models Explainable》一书中提到了一些对可解释性方法分类的参考标准,如图2所示。
图2 解释方法分类
(1)针对特定模型的还是通用的?
与模型无关的的解释方法可用于任何训练后的机器学习模型,通常通过分析特征输入和输出对来进行解释,而不涉及解释模型的内部信息如权重或结构信息。依赖于模型的解释方法仅限于特定的模型。如线性模型中回归权重的解释,决策树的规则,仅用于解释神经网络的工具是特定于模型的解释。
(2)内在或事后?
内在解释性是指解释性好的模型(如线性模型、决策树)或将可解释性结合到具体的模型结构中使模型本身具备可解释能力。事后解释性意味着选择和训练一个模型(如集成方法、神经网络)并在训练后应用可解释性方法(如置换特征重要性,PDP),它与模型训练过程是分离的。事后方法也可以应用于内在可解释的模型,如计算决策树的特征重要性。
(3)局部还是全局?
解释方法是解释单个预测结果(个体解释)还是整个模型行为(总体解释)。全局可解释性是指帮助人们理解复杂模型背后的整体逻辑以及内部的工作机制;局部可解释性是指帮助人们理解机器学习模型针对每一个输入样本的决策过程和决策依据。全局和局部可解释性如图3所示。
图3 全局和局部可解释性
上述划分并非正交,而是有重合的,如LIME方法是模型无关的解释方法,它既属于训练后解释也属于局部解释方法。
解释方法
具体的解释方法见表1,每种方法都有其优缺点和适用场景,实际应用时需要根据具体需求和模型类型进行选择。
表1 具体的解释方法
各种解释方法,最终可以形成不同的解释结果:
一是特征汇总统计,许多解释方法为每个特征提供汇总统计。有些方法对每个特征返回一个值,例如特征重要性,或者返回一个更复杂的结果,例如成对特征交互强度,它由每个特征对的值组成。
二是特征汇总可视化,大多数特征汇总统计也可以可视化。有些特性汇总只有在可视化的情况下才有意义,如呈现特征的部分依赖关系。部分依赖图(PDP)就是显示特征和平均预测结果的曲线。
三是基于样本,此类别包括所有返回数据点(已经存在的或新创建的)以使模型可解释的方法。如反事实解释、原型样本等。
四是代理模型,解释黑箱模型的一个解决方案是用可解释模型(全局或局部)对其进行近似。通过查看可解释模型的内部参数或特征汇总统计信息来解释。
五是模型组件(如学习权重),对本质上可解释的模型的解释属于这一类,如线性模型中的权重或决策树的树结构(用于分裂的特征和阈值)。模型组件和特征汇总统计之间的界限是模糊的,如线性模型中权重同时是模型组件和特征的汇总统计。另一种输出模型组件的方法是在卷积神经网络中学习到的特征检测器的可视化。输出模型内部的可解释性方法根据定义是依赖于模型的。
(1)模型无关的解释方法
①特征相关解释方法
这类方法主要通过分析输入特征对模型输出的影响,来解释模型的决策过程。特征是模型的输入,它被认为是可解释的,这意味着很容易理解它们的含义,比如一个人的性别和年收入。特征的可解释性是一个很大的假设,但是如果很难理解输入特征,那么理解模型就更难了。特征相关解释方法主要有:
一是部分依赖图(partial dependence plot,PDP),显示单个特征值变化时预测结果的平均变化趋势,或两个特征之间的交互效应对目标变量的影响。在金融信贷领域,可以用来分析收入水平、信用历史长度等单一特征如何影响贷款批准率。
二是个体条件期望(individual condition expectation,ICE),ICE曲线与PDP类似,但它展示的是每个样本在特定特征变动下的预期输出,而非所有样本的平均情况。对于个性化风险评估,如评估某个客户提高信用评分对贷款利率的影响,ICE提供更细致的个体层面解释。
三是累积局部效应(accumulated local effect,ALE),主要用于量化和可视化单个特征对模型预测结果的影响,特别强调解决特征间的相互作用问题。金融机构可以用ALE图揭示不同信用等级区间内的违约概率变化规律。
四是特征交互(feature interaction),分析特征之间的交互作用有助于发现非线性关系和条件依赖。例如,在保险定价中,可能需要考虑年龄和驾驶经验这两个特征间的交互影响,以准确反映风险水平。在资产配置中,研究不同证券类型(股票、债券)之间的交互影响,有助于优化投资组合策略。
五是置换特征重要性(permutation feature importance),通过随机打乱特征的值,观察模型性能的变化来度量特征的重要性。在金融欺诈检测中,可用于确定哪些特征对识别欺诈行为最重要。
六是Shapley值, 来自合作博弈论的概念,用于评估每个玩家(特征)对游戏(模型预测)结果的贡献。在信用卡额度分配中,运用Shapley值可以帮助量化教育背景、职业等因素的具体贡献度。
②基于样本的解释方法
这类方法通过分析特定样本或一组样本,来解释模型的决策原因。主要包括:
一是反事实解释,探究如果某些特征值发生变化,预测结果会如何改变,是一种局部解释方法。例如,银行可以向客户提供“如果您的年收入增加10%,您获得更低贷款利率的可能性会提升多少”的反事实信息。
二是对抗样本,通过对输入样本进行细微的修改,欺骗模型做出错误的预测。在金融欺诈检测中,可以用来测试和改进模型的鲁棒性。也可以被用作解释工具,如在信用评级系统中找到使优质客户被误判为高风险客户的最小输入变化。
三是原型样本,在信贷决策中,原型样本解释方法能找到最接近当前申请人的已知客户群,并以此为基础解释为何申请人获得了当前的信贷决策结果。
四是有影响力的样本,识别训练集中对特定预测结果最具影响力的样本,了解模型背后的训练数据特点。例如,识别导致模型偏见或者异常预测的代表性数据;在金融市场预测中,分析哪些历史数据对模型预测最重要。
③代理模型解释方法
利用相对简单且可解释的模型(代理模型)来近似复杂模型的预测结果,以此解释复杂模型的决策逻辑。
一是全局代理模型:使用一个简单模型来解释另一个原始复杂模型的整体行为。例如,在金融投资策略开发时,简化模型可以清晰地表达各因素与投资回报的关系。在银行信用风险评估中,可能使用决策树代理复杂的神经网络模型,以便于监管机构和非技术人员理解模型的决策逻辑。
二是局部代理模型(如LIME):通过构建一个局部代理模型来解释复杂模型对单个样本的预测。在实际应用中,比如针对某个具体的信贷拒绝案例,LIME可以生成一个局部线性模型来解释主要影响决策的因素及其权重。在客户风险评估中,帮助解释为何某个客户被分类为高风险。
(2)依赖于模型的解释方法
依赖于模型的解释方法适用于特定的模型,因为每个解释方法都基于模型的参数和内部结构,包括传统的自解释模型和特定模型的解释方法。
自解释模型指模型本身是可解释的,即对于一个已经训练好的学习模型,无需额外信息就可以理解模型的决策过程或决策依据,通常采用结构简单、容易理解的模型。这也使得与其他机器学习模型相比,自解释模型的预测效果通常较差。传统的自解释模型包括基于规则的方法、线性模型、逻辑回归、决策树、k近邻(一种基于样本的可解释的机器学习模型)、RuleFit、朴素贝叶斯、知识图谱、聚类、关联规则学习等。
特定模型的解释主要基于模型的内部结构。近年来,此类方法的研究主要集中于深度神经网络的可解释性,主要包括深度学习重要特征(deep learning important features,DeepLIFT)、注意力机制、显著图(saliency maps)、遮挡实验(Occlusion Experiments)、积分梯度(Integrated Gradients)、层方向的关联传播(layer-wise relevance propagation,LRP)、激活最大化(activation maximization,AM)、基于梯度的方法以及类激活映射(class activation mapping,CAM)等。
在实际应用中,需要综合考虑模型的性能和可解释性,以选择最适合的方法和技术。总的来说,模型的可解释性是一个活跃且持续的研究领域,它对于增强人们对机器学习模型的信任度和接受度至关重要。未来,针对可解释性的度量(如何定义一个模型的可解释性,如何量化它?)、与隐私和安全的交互(在提高模型可解释性的同时,如何确保不泄露敏感信息?)、结合机器学习和可解释性(如何设计既高性能又易于解释的机器学习模型?)等问题仍需进一步探讨。
三、XAI在金融行业中的应用
在金融行业中,可解释AI有着广泛的应用。以下是一些具体的应用场景:
(1)信贷审批与风险管理
可解释AI模型可以用于信用评分系统中,对申请人的资质进行评估。通过揭示影响信用评级的关键因素及其权重,金融机构能够清晰地理解为何某个客户获得特定的信用分值或贷款批准/拒绝决定,从而保证决策过程公平、透明且符合监管要求。
(2)反欺诈检测
在识别异常交易和预防金融欺诈时,可解释AI能够提供可疑交易特征的重要性和贡献度分析,帮助分析师快速定位欺诈行为的原因并采取行动,同时也能为后续规则制定提供依据。
(3)投资策略与智能投顾
可解释AI应用于投资决策支持系统中,能解析投资组合优化背后的逻辑和市场动态的影响因子,让投资者不仅能获取投资建议,还能明白建议产生的原因,增强投资决策的信心。
(4)合规审查与审计
金融机构需定期接受内外部审计及监管机构检查,而可解释AI模型有助于满足监管关于算法透明化的要求,方便第三方验证模型预测结果的合理性和公正性。
(5)个性化推荐与客户服务
基于可解释AI技术的客户关系管理系统可以根据客户的行为数据和偏好生成个性化的金融服务推荐,并向客户提供解释,说明为什么这些产品或服务最适合他们,从而提高客户满意度和忠诚度。
(6)保险定价与承保
保险行业利用可解释AI模型确定保费价格或承保条件时,可以明确展示出影响定价的具体风险因素,这样既能保证定价合理性,又能提升客户的信任感。
四、总结
可解释人工智能以其独有的优势,正在逐步改变金融行业的运作模式和服务形态,提升了金融服务的智能化和透明度。尽管目前仍面临诸如解释准确性、完整性等方面的挑战,但随着相关研究和技术的发展,可解释人工智能在金融领域的应用前景将更加广阔。未来,它将在保障金融业务安全、提升效率、优化用户体验以及维护社会公平正义等方面发挥更加重要的作用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-23
AI+金融:AI知识检索Hebbia
2025-01-16
朝阳永续 FastGPT 最佳实践:AI 赋能金融数据服务的完美选择
2025-01-15
解锁 LangGraph和OpenAI,打造金融分析智能体
2025-01-04
智能金融文档处理:如何用Agentic工作流程重塑决策未来?
2024-12-28
刘曙峰|金融行业大模型应用观察
2024-12-26
AIGC技术实战 | AI智能问答与财富管理业务结合实践探索
2024-12-25
AI战略丨大模型时代,基金投顾AI应用探索
2024-12-25
招商银行发力“AI+金融”,从平台型组织向数据驱动组织转型
2024-04-30
2024-07-18
2024-07-10
2024-07-04
2024-11-26
2024-06-11
2024-06-20
2024-03-29
2024-07-04
2024-05-06