微信扫码
与创始人交个朋友
我要投稿
人工智能技术的快速发展正不断地推动着金融科技领域的革新。这一变革不仅仅关乎技术的演进,更在于它如何成为推动全球经济增长的新动力。在日前举办的“人工智能 X 金融科技创新大会”上,汇丰财富管理与个人银行的全球首席架构师夏勇博士就这一趋势分享了他的见解。他认为,AI 的确会给金融行业带来新的增长点,但同时 AI 在银行业的应用仍存在不少疑虑和挑战,无论如何,发展中产生的问题只能用发展来解决。
以下为夏勇博士的演讲实录,内容经 InfoQ 进行不改变原意的编辑。
关注「InfoQ 数字化经纬」公众号,后台回复「汇丰」即可获取本次演讲 PPT
AI 热潮爆发时,作为银行从业者,我们首先关注的就是 AI 可能带来哪些经济增长。在过去几年里我们能够看到,如传统的高级分析、传统机器学习和深度学习等数据分析方法等已经为社会带来了巨大影响。
根据麦肯锡的调查,这些技术已为全球经济带来 11 万亿到 17 万亿美元的增长,而生成式 AI 可能还会额外带来 2.6 万亿至 4.4 万亿美元的增长,这相当于一个英国的 GDP,再具体一点也就是中国 GDP 的五分之一。若生成式 AI 的影响与传统技术的影响相叠加,最终会带来 17.1 万亿到 25.6 万亿的增长,接近美国一年的 GDP。
其次,我们还关心为业务部门开发的这些产品 IT 系统的建设。目前,我负责汇丰财富管理和零售银行的全球架构工作,这方面业务在全球的历史遗留应用大约有几千个,其中一些核心系统的建设可追溯至 60 至 70 年前,甚至更早,其中有一些程序还是用汇编语言编写的。这种语言在现在的大学课堂上都已不常见,因此其维护和更新是一项巨大的工程。然而,从另一方面来说,这些遗留系统中也沉淀着丰富的银行业务知识和多年的行业经验。
我们的任务就是将这些传统代码中蕴含的知识提取出来,并以此来理解金融业的历史发展。基于这些历史数据和知识,我们可以探索银行业务的未来机遇,寻求为客户提供更优质服务的可行方式。这对我们而言,特别是对我们银行内部做创新工作的同事们来说,是一个值得关注的议题。
同时,这些语言和大模型有所不同,它们其实是一些私域数据。如何将大模型的通用知识与我们银行的这些私域知识结合起来,以推动金融领域未来发展?这是一个我们觉得很有意思、但也非常必要的工作。
此外,随着人工智能技术的发展,我们现在能够提供比传统人工客服更高效的智能客服,这无疑将成为我们未来工作的一个重要方向。在市场营销、销售等其他领域,我们也将继续探索和应用新技术,以提升整体的业务效能。
作为一个受知识和技术驱动的行业,银行业的营销、客户运营等业务都已从先前存在的 AI 应用中获得了显著的好处。而生成式 AI 应用则可以提供额外的好处,特别是因为文本模态在诸如法规和编程语言等领域非常普遍,并且银行业面向客户,拥有许多 B2C 和小型企业客户。行业特点使银行业很适合集成生成式人工智能应用:
持续的数字化努力以及传统的 IT 系统。银行已经在技术方面投资了数十年,积累了大量的技术债务,以及一个孤立和复杂的 IT 架构。
面向大客户的工作力量。银行业依赖于大量的服务代表,如呼叫中心代理商和财富管理金融顾问。
严格的监管环境。作为一个受到严格监管的行业,银行业有大量的风险、合规和法律需求。
知识工作者领域。生成式人工智能的影响可能贯穿整个组织,帮助所有员工编写电子邮件、创建业务演示文稿和其他任务。
下图展示了我们能预见到的 AI 在银行业的潜在应用领域与职能,包括投资银行、资产管理、对公业务、财富管理、零售银行等等。
虽然这些应用的前景看起来很光明,但我不得不提的是,金融业、银行业都是重监管的部门,因为它们涉及到公众的薪资和养老金等重要资产。银行从业者肩负着重大的社会责任,这就要求我们在使用新技术时必须要秉持十分谨慎的态度。无论是对国家而言,还是对银行业而言、对银行业从业者而言,我们自身的信用都是最重要的。
AI 大语言模型的应用其实有很多技术路线,但本质上我们从数学角度来看,它其实只有两种:统计学方法和推理方法,也就是数字驱动和知识驱动。在我们的实际应用中,一定是将这两种方法相结合使用的。
我们今天能够看到,基于统计学方法的大型语言模型在金融业,尤其是银行业中的应用引发了一系列问题。如同刚刚提到的,银行承载着客户的工资、养老保险和退休基金等重要资产,这些业务对精确性的要求极高,我们必须确保所提供的服务和产品具备极高的准确性。因此,在开发和应用 AI 技术时,除了统计学模型和大型语言模型所提供的知识以外,我们还必须结合基于推理方法的知识驱动。
银行业在利用生成式 AI 的路上既面临机遇又要应对挑战:
在近两年的“百模大战”中,我比较关注大模型在银行业,特别是 IT 方面的使用。从技术背景上来谈,大模型主要在以下几个方面发力:
海量数据训练:学习词汇、语法、句法结构等语言要素,具备生成流畅、连贯文本的能力;
多领域知识:能够处理来自不同领域的问题;
丰富的语言表示:将输入转化为高维向量表示,捕捉了语义、句法、语境等多个层面的信息;
上下文理解:理解上下文并生成连贯的回复,能够更好地回应复杂的问题;
可定制性 / 可持续学习:垂直领域数据微调。
但包括汇丰在内,目前全球范围内银行业直接用于 client facing 的大语言模型项目并没有真正落地。这主要受到了两个因素的影响:一是整个银行业的谨慎态度,二是监管因素。
在 client facing 落地之前,我们先开始了 staff facing(面向员工)的大模型研发应用。同时由于 IT 部门员工最熟悉大语言模型,故这一技术最先对他们开放。
虽然我们在文本方面看到了大语言模型的一些令人惊喜的能力,但我们今天的大语言模型仍然需要与人协作,基本上还是一个“Copilot”,而非“Autopilot”。因此面向员工的大模型应用的起始点就是,在整个软件开发的生命周期内,利用大语言模型帮助提高银行业务。
银行积累了大量的技术债务,并拥有分散且复杂的 IT 架构。我们目前在用 AI 辅助经济 API 软件的开发,让 AI 帮助事故处理等一系列 IT Operation 方面的工作。我们始终将大型语言模型视为与开发者协同工作的辅助工具,而非完全替代人类工作的自动化工具。
如果一家创业公司的新系统上线后因使用人数超出预期而崩溃了,舆论会持宽容的态度,反而认为这是新系统太受欢迎、是一件好事;而如果银行系统崩溃,则一定会遭受全球媒体的负面报道。这种监督压力使我们在用 GAI 时不会直接在面向客户的领域上线新项目,但 GAI 可以用于提高系统的鲁棒性,或在需求变更时提高帮助。
当系统运行出现事故, GAI 还可以自动推测软件 bug,我们也形成了一套 AI 驱动的事故管理系统。
此外,在银行业务方面,随着 GAI 技术的发展,我们的工作必须“道高一尺魔高一丈”。在风险合规方面,曾经的人脸识别、活体识别技术几乎已被 GAI 打败,这些技术必须跟随 GAI 一同进步,就比如现在的人脸识别环节都要求用户摇摇头、眨眨眼。
在下图呈现的更多银行业 AI 应用场景中,知识产权管理是一个值得关注的议题。当前,多模态模型的发展引发了关于模型训练中使用语料的知识产权问题的讨论。这些训练材料是否受知识产权保护?我们能否使用这些材料?根据现有的知识产权法律体系,大型语言模型在知识产权方面的合法性存在疑问,这方面的法律需要与时俱进。
尽管最新技术如使用 AI Agent 已取得显著进展,但这些技术的实际效果与面向消费者的(to C)应用相比仍有差距,特别是在处理私域数据方面。对于小规模训练样本的数据,AI 技术所能发挥的作用相对有限。此外,AI 技术的应用主要集中在银行后台 staff facing 的员工使用领域。这是 AI 技术需要进步的方面。
刚刚提到的这些应用场景中,我们并没有探索全部场景并取得较好效果,下图标红的应用是我们尝试后觉得比较有信心、能够很快有所提高的。
在谈到 AI 特别是 GAI 时,有两种态度:第一,一种没必要的悲观情绪;第二,过于乐观的清晰。对于这件事,我认为既不需要觉得 AI 可以完全替代程序员了,也不用走另一个极端、期待 AI 带来非常大的提升。我们通过自己的实验发现,AI 能够提高 20% 到 30% 的效率。大家可能觉得这个数字很小,但比如我负责的架构部门有几千个程序、在全球有大规模的 IT 人员,如果都能提高 20%-30% 的效率,就将积累出很可观的效果。
最后我想谈一谈银行业 AI 应用面临的挑战。作为银行业从业者,我们一直在谈风险,银行业务的本质其实就是 Risk Management(风险管理),关乎到我们怎么看 credit(信用)、怎么看 liquid(流动性)风险的问题。我们在实践中发现,发展中的问题只能用发展来解决,回避肯定不是好方法。
今天我们在私域数据、强监管领域里看见了各种各样的风险挑战,但 AI 带来的技术进步同样不容忽视。在当前情况下,我们只能用发展的、更先进的技术来解决发展中产生的疑惑,包括歧视、数据安全、诈骗、风险监管等等方面。
那么随着 AI 技术不断发展,我们所有人都会被 AI 取代吗?传统岗位会不会全部不复存在?我认为“工作”本来就不一定是人必不可少的一个部分,如果 AI 技术真的发展到能够完全取代人的工作的地步,也未尝不是一件好事,我们可以做更多工作以外的事。
我相信无论是歧视、数据安全、诈骗、风险监管这些具体的问题,还是我们自身生存、工作这些更广泛的问题,都会在有了新技术后找到其他意义。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-04-30
2024-07-18
2024-07-04
2024-07-10
2024-06-11
2024-06-20
2024-03-29
2024-07-04
2024-06-29
2024-07-10