AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


商业银行基于大模型的研发辅助应用研究
发布日期:2024-07-28 09:18:12 浏览次数: 1981 来源:BanTech智库


作者:

广发银行研发辅助课题组


课题组成员:邓俊峰、汪皎洁、刘远圳、张金华、符传铭、张思勤、王天健、唐磊、廖泽宇、黄小云、赵一骏、徐博等

摘要:

当前,以大模型为代表的人工智能技术正悄然引领着新一轮科技革命和产业变革。商业银行积极探索大模型在企业内部各场景的应用,并不断创新大模型的应用设计模式,为银行业务发展带来了全新机遇。课题组已开展辅助编码、辅助数据开发、辅助数据分析3个场景的研发及试点应用,实现研发提质增效、减员降本等效益。


关键词:大模型;代码生成;数据开发;数据分析


一、研究背景

随着人工智能技术的快速发展,商业银行正积极探索大模型技术并加速其在金融科技领域的应用。然而,在成本控制的背景下,IT研发部门面临着如何降低成本并提高效率的挑战。据了解,人力成本占据科技IT研发投入的大部分。尤其是在开发编码、数据开发、数据分析等岗位上,效率的提升变得尤为重要。因此,商业银行需要思考如何创新应用设计模式,以降低人力成本并推动大模型技术的发展。只有通过降本增效,才能更好地利用人工智能技术在金融科技领域的优势,实现科技革命和产业变革的目标。

 1

大模型辅助编码

辅助编码是指通过IDE插件或集成开发工具来完成包括常规的代码提示、代码生成、代码转换、代码注释、代码搜索功能以及代码审核、智能问答等高阶功能,以提升开发效率,降低研发成本。

 2

大模型辅助数据开发

商业银行的数据来源广泛且格式多样,大模型能够基于其强大的数据处理能力,自动完成数据清洗、转换和标准化工作。通过识别并纠正数据中的错误、不一致和冗余信息,大模型确保数据的质量和一致性,为后续的数据分析打下坚实基础。在复杂的数据环境中,大模型能够智能地识别不同数据源之间的关联关系,实现数据的自动集成与整合。通过构建统一的数据视图,大模型帮助商业银行打破数据孤岛,实现跨部门、跨系统的数据共享与利用。

 3

大模型辅助数据分析

大模型在数据分析领域的核心优势在于其强大的预测分析与模式识别能力。通过对历史数据的深度学习和挖掘,大模型能够发现数据背后的隐藏规律和趋势,为商业银行的风险评估、客户画像、产品推荐等提供精准预测和决策支持。大模型还能将复杂的分析结果以直观、易懂的可视化形式呈现出来,帮助非技术背景的决策者快速理解数据背后的意义和价值。通过构建交互式的数据分析平台,大模型为商业银行的各级管理者提供实时、动态的数据洞察和决策辅助。 


二、大模型研发辅助应用的关键问题

 1

编码大模型无业务技术领域知识

通过前期调研,目前市面上己推出不少编码大模型产品,但是这些产品并不能很好地满足课题组所在商业银行的实际业务需求,无法生成符合我行技术框架、编码规范和业务特性的代码。

 2

数据开发人力成本高

数据开发人员在日常工作中需要使用数据开发平台编写大量ETL脚本,数据加工流程总数已达数十万,这些ETL脚本都依赖人工编写,耗费大量人力。

 3

数据使用门槛高、实施周期长、成本投入高

日常经营管理需要频繁使用数据,传统数据获取途径主要依赖数据分析人员通过数据分析平台的数据接入、数据分析、报表等功能实现,不同程度上存在对数据分析人员技能要求高、系统开发实施周期长、成本投入高等问题。 


三、大模型研发辅助应用的解决方案

基于大模型训练微调及RAG(检索增强生成)等相关技术,在前后端编码平台、数据开发平台、数据分析平台实现智能辅助功能,提升工作效率。

 1

总体架构

大模型研发辅助的总体架构如图1所示。


图1 大模型研发辅助的总体架构

 2

辅助编码

借助大模型,通过提示词工程和RAG,提取代码上下文信息,来完成包括常规的代码生成、代码转换、代码注释、代码解释、代码补全、代码搜索功能以及代码评审、智能问答等高阶功能。

支持前端、后端、APP端和其它编程语言清单见表1。

表1 编程语言清单


主要功能有:

(1)单行、多行续写,根据上文内容,推理出接下来的一行、一段代码的内容,在编码过程中等待一下,即可看到推荐内容。

(2)中文生成代码,根据特定格式输入程序功能描述,生成一段代码。

(3)代码转换,由一种代码语言转换为另一种代码语言,例如将SAS语言转换为Python,并适用于Python生产环境。

(4)代码生成注释,给定一段代码,生成代码段的文档、函数注释。

(5)代码搜索,根据代码或者注释对代码进行搜索,辅助开发人员快速找到需要参考的代码。

 3

辅助数据开发

利用大模型理解数据加工需求、辅助生成技术口径、筛选数据表,进而生成数据加工SQL语句,最后帮助数据开发人员完成数据加工流程研发。

(1)理解数据加工需求:通过自然语言处理技术理解用户提供的数据加工需求,包括数据源、数据格式、数据清洗和数据整合等方面。

(2)辅助生成技术口径:根据用户提供的数据加工需求,生成相应的技术口径,包括数据类型、数据格式、数据结构等。

(3)筛选数据表:根据用户提供的数据加工需求和技术口径,利用大模型来筛选出相关的数据表,并给出相应的建议和指导。

(4)生成数据加工SQL语句:根据用户提供的数据加工需求、技术口径和数据表,我们可以生成相应的数据加工SQL语句,并对其进行优化和验证,确保其正确性和有效性。

 4

辅助数据分析

数据加工好后,需要帮助业务灵活查数。用户根据需求提问,模型经过分析问句可快速查找到需要的数据,并对其进行灵活的处理和使用。其中包含数据探源模块和SQL生成模块。行内有大小数百个应用,每个应用都有数十至数百张表。数据分析人员往往在分析业务口径选择源数据时需要从数据资产列表中耗费大量时间查找。通过命名实体识别模型和ES模糊匹配等不同机制实现数据表的查找筛选排序,查找相关表并按相似度高方式排序返回最接近的数据库表,大大提高数据开发和数据探源的效率。SQL生成模块是在分析主流NL2SQL模型的基础上,选取SPACE-T模型做微调训练提升效果,根据业务需求和数据探源结果准确生成查数所需SQL代码,实现快速查数用数。辅助查数用数SQL代码生成流程如图2所示。

图2 辅助查数用数SQL代码生成流程 


四、大模型研发辅助应用的创新点

 1

编码模型理解行内业务技术知识

通过提示词工程和RAG,可以生成不同场景的类和方法粒度的完整代码,且符合行内统一研发平台框架及编码规范,提升研发编码效率和速度。以往开发人员编码需要互联网搜索解决方案、查阅开发规范及接口说明、搜索GIT等一系列操作才能在IDE上完成代码开发,现在只用在IDE上安装插件,即可辅助开发人员完成一站式交互式编码。

 2

数据加工ETL脚本自动化生成

大模型辅助数据开发人员开展数据加工ETL研发,赋能数据开发全流程,缩短数据加工周期。

 3

数据分析全流程智能辅助

在业务人员查数场景中,大模型帮助业务人员快速选表和生成SQL,快速实现数据统计需求。大模型技术贯穿数据分析全流程,降低了分析的门槛,提高了生产力,让数据更高效地发挥价值。 


五、大模型研发辅助应用的效果

 1

辅助编码效果概述

目前已将辅助编码功能在内部推广实践,在开放银行接口管理、对公贷款核心系统、运营管理应用等多个方面开展使用。该技术覆盖了从基础技术代码到高度定制化的业务逻辑代码,展现了其在多种场景下的适用性。与人工编码相比,大模型辅助下的编码效率实现了显著提升,平均提升幅度约为15%~20%,具体提升效果因项目复杂度而异。开发人员普遍表示,大模型生成的代码在质量、可读性和遵循编码规范方面,达到了与资深开发人员手动编写相近的水平。

 2

辅助数据开发效果

借助大模型技术赋能研发效能提升,实现效能提升。经验证,经过初步规范化输入加工口径后,生成指标加工SQL代码的结果平均准确率达到了85%,表关联和过滤条件的准确率也分别稳定在80%和83%左右。

 3

辅助数据分析效果

智能数据分析助手已应用于数十个分行,服务于分行用户的日常查数用数场景。目前表数据库拥有8万多张数据表,覆盖多个数据集群,表定位准确率70%,数据查询成功率65%。

END

前期精彩原创推荐(点击图片进入阅读):


这是科技创新最好的时代,这是属于我们每个人最好的时代,关注“BanTech智库”,专注银行科技发展,探索无界金融生态!


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询