微信扫码
与创始人交个朋友
我要投稿
量化投资已成为主流投资方法之一,经历了 Quant 1.0 - 3.0 的发展。Quant 3.0 虽在某些策略场景成功,但存在成本高、模型难理解和依赖大数据等局限。为解决这些问题,提出 Quant 4.0,其具有自动化 AI、可解释 AI(XAI)和知识驱动 AI 三个关键组件。自动化 AI 实现量化研究和交易的端到端自动化,提高效率;XAI 增强模型透明度和可解释性,利于风险控制;知识驱动 AI 补充数据驱动方法,适用于低频投资场景。本文还讨论了如何构建 Quant 4.0 系统,LLMs 在量化投资中的应用,以及量化技术面临的 10 大挑战和研究方向。
AGI;人工智能;AutoML;因果工程;深度学习;特征工程;投资工程;知识图谱;知识推理;知识表示;模型压缩;NAS;Quant 4.0;量化投资;风险图;XAI
量化投资的发展历程
Quant 1.0:涉及小而精英的团队,应用数学和统计工具分析金融市场,被称为 “alpha 工作室” 模型。
Quant 2.0:大量投资研究人员在标准化管道上工作,寻找有效 alpha 因子,即 “alpha 工厂” 模型。
Quant 3.0:将注意力从因子挖掘转移到深度学习建模,利用深度神经网络的端到端学习能力,实现具有简单因子的强大预测模型,称为 “深度 alpha” 模型。
起源与发展:量化投资是财富管理行业的重要组成部分,结合了金融工程、计算机科学等多学科。其起源于一个世纪前,许多学者如 Markowitz、Samuelson、Black 和 Scholes 等为其发展做出贡献,量化在工业中的发展始于 20 世纪 90 年代,经历了 Quant 1.0 - 3.0 的演变。
Quant 1.0 - 3.0 的特点
Quant 3.0 的局限性及 Quant 4.0 的提出
Quant 3.0 的局限性:构建深度神经网络成本高,模型难理解,且依赖极大量数据,限制其在数据匮乏场景的应用。
Quant 4.0 的提出:定义下一代量化技术,通过 “all - in on AI” 理念,包含自动化 AI、可解释 AI 和知识驱动 AI 三个支柱,以提高量化投资的效率、可解释性和决策质量。
自动化量化研究管道
传统量化研究流程:包括数据预处理、因子挖掘、建模、组合优化、订单执行和风险分析等模块,各模块有其特定功能和任务。
自动化流程的改进:Quant 4.0 提出自动化流程,利用先进 AI 技术,实现更高效的量化研究和交易。在自动化流程中,重点关注自动化因子挖掘、自动化建模和一键部署三个核心模块。
自动化因子挖掘
符号因素挖掘:可看作符号回归的特例,包括 operand 空间、operator 空间、搜索算法和评估准则四个部分。需定义可用于因子挖掘的元因子、算子,选择合适的搜索算法(如蒙特卡洛、遗传编程、梯度方法等),并通过信息系数等评估因子质量,同时过滤冗余因素以保持信息多样性。
机器学习因素挖掘:通过训练神经网络来挖掘,其表示能力更强,能拟合更复杂的非线性关系。挖掘过程相当于训练神经网络的过程,编码器将元因子映射为潜在向量表示(嵌入),解码器将其转换为结果,嵌入本身也可作为机器学习因素,应用于下游任务。
因子挖掘的传统方式与挑战:传统上,量化研究人员基于专业知识和市场理解手动探索和开发金融因子,效率较低且难以规模化。
自动化因子挖掘的方法:将特征工程表述为搜索问题,利用算法从元因子中生成具有满意回测性能的金融因素。根据因素的表达形式分为符号因素和机器学习因素。
自动化建模
AutoML 系统的关键问题:标准 AutoML 系统需要回答搜索什么(即搜索空间)、如何搜索(即搜索算法)和为什么搜索(即性能评估)三个问题。
搜索空间设计:从网络架构(包括从低级别算子到高级模块的分层配置)、超参数(如学习率、批量大小等)和训练目标(如均方损失、交叉熵损失等经典损失函数及专为量化任务设计的新损失函数)三个方面设计搜索空间。
搜索算法选择:包括网格和随机搜索算法(简单易实现但难以扩展到高维空间)、进化算法(通过进化机制改进模型配置)、强化学习(将架构搜索建模为马尔可夫决策过程)、贝叶斯优化(利用代理模型探索搜索空间)和基于梯度的方法(在目标函数梯度存在时高效,但自动化建模中搜索空间通常离散)等。
模型评估与计算成本优化:模型评估通常是计算瓶颈,因训练深度神经网络到收敛耗时。可通过在收敛前停止训练、选择较少样本加速训练、热启动模型训练或利用过参数化 “父” 模型信息等方法降低计算成本。
深度学习自动化建模的复杂性:深度学习模型的配置包括架构、超参数和训练目标,这些因素共同决定模型性能,且其自动化建模面临端到端属性和网络架构问题,导致复杂性增加。
AutoML 在自动化建模中的应用
自动化一键部署
优化方向:分为前端优化和后端优化,以在不影响模型语义的前提下简化模型计算并适应硬件特征,加速推理并减少模型大小。
具体技术:包括模型修剪(去除对神经网络激活影响小的连接和神经元)、模型量化(将参数从浮点数转换为低比特表示)、知识蒸馏(将复杂模型知识压缩到较小模型中)和低秩分解(通过矩阵分解等技术压缩模型)等微观层面技术,以及利用知识图谱等宏观层面技术。
模型部署的挑战与重要性:模型部署涉及将开发的模型从离线研究转移到在线交易,不仅是代码和数据转移,还包括数据和因子依赖同步、交易服务器和系统适配、模型推理调试、计算延迟测试等,对于高频交易和算法交易场景的深度学习推理加速至关重要。
模型编译和压缩技术
XAI 的重要性与量化应用
XAI 的重要性:XAI 是确保 AI 模型可信度和稳健性的关键,在量化中能使决策过程更透明,为研究者和投资者提供有用见解,揭示潜在风险暴露。
XAI 在量化中的应用维度:将 XAI 任务分解为股票、时间和因子三个维度,以增强量化模型的可解释性。
XAI 在不同维度的应用
因子类型:因子可按数据源、财务特征和时间尺度分类,特征重要性算法可计算不同类型因子对投资组合回报的贡献,帮助理解 AI 生成的投资策略。
因子交互:深度学习模型能捕捉因子间复杂关联,特征交叉技术可揭示因子交互,发现新因素和模式。
因子层次结构:因子间语义相似性可通过层次聚类等技术描绘为因子进化图,展示因子关系,为投资决策提供参考。
极端市场:市场极端情况下量化策略难获超额收益,可通过分解股票回报,将因素分为市场因素和股票特定因素,选择股票特定因素重要性超过市场因素的股票进行交易。
日历效应:日历相关的市场模式会影响市场趋势,可通过特征重要性算法识别日历因素对模型预测的影响,调整投资策略。
风格转换:多因子模型中的风格因子对股票回报有贡献,回报随市场风格偏好变化。可通过分析风格暴露与股票回报关系,检测风格转换信号,调整投资策略。
事件影响:突发事件对股市影响大,可利用 NLP 技术编码事件内容为相关特征,计算事件重要性和因果解释,减少负面影响或获利。
股票相似性:通过分析股票嵌入的相似性,结合金融工具间关系,可提高分析和预测准确性,同时了解模型所学。需选择合适的相似性度量,相关研究包括度量学习和图结构学习等。
领先 - 滞后效应:股票趋势存在领先 - 滞后关系,投资者可通过识别获利,但准确识别有难度,需通过因果推理,而在金融市场中基于历史数据的反事实推理通常不可行。
行业趋势:行业对个股趋势有影响,可将股票行业成员视为分类特征,通过特征重要性算法确定其重要性,分析行业与其他特征的交互,为投资决策提供有价值解释。
股票解释
时间解释
因子解释
知识表示
组成与构建:通常由本体(定义实体和关系类型及语义含义)和实例(以语义三元组表示实体间关系)组成。构建金融行为知识图谱需从多源获取金融实体、事件及因果关系等信息,面临数据提取、矛盾信息处理、不完整数据推断和不同更新频率数据对齐等挑战。
知识获取技术:包括知识提取和知识图谱完成,可利用 LLMs 进行知识提取,给定适当编辑的提示,无需特定模型且能保持较好提取精度。
知识表示的目标与发展:知识表示旨在将人类知识编码为机器可读形式,是知识驱动 AI 的基础。从早期的语义网络到逻辑 - 基于知识表示(如模糊逻辑、专家系统等),再到大数据时代的知识标准(如 RDF、OWL)和知识图谱技术,知识表示不断发展。
金融行为知识图谱
知识推理
知识推理的方法与应用:知识推理基于现有知识和数据进行分析、推断等,包括符号逻辑(确定性或概率性)、神经和神经符号方法。在量化中,知识表示可作为外部信息纳入现有因子,通过神经推理计算事件、关系和知识图谱的嵌入,用于投资策略中的交易决策生成。
相关研究实例:如 Ding 等通过结合关系和分类知识改进事件嵌入;Deng 等从新闻文本中提取事件并与知识图谱对齐预测股票价格;Feng 等利用图卷积计算股票嵌入预测回报;Long 等基于知识图谱生成股票嵌入并增强原始因子;还有其他研究利用知识图谱生成更好的股票嵌入或进行事件驱动投资。
离线研究系统
硬件与数据层:底层硬件为高性能计算集群,数据层收集大量金融数据,包含不同类型数据库系统,如 SQL、时间序列、NoSQL 和图数据库,还需高效分布式存储系统和内存数据库缓存高频数据。
因子挖掘系统:由元因子层、因子层和因子库组成。元因子层预处理原始数据,因子层基于自动化因子挖掘管道构建挖掘引擎,因子库存储、计算、管理因子并进行回测和跟踪分析。
知识系统与建模系统:知识系统利用分布式图计算平台提供知识驱动 AI 能力,存储金融行为图;建模系统负责自动生成机器学习模型,通过 AutoML 模块实现算法,风险和模拟模块进行风险评估和市场模拟。
在线交易系统
部署层:包括计算调度模块(基于数据依赖安排计算顺序)、自动化部署模块(实现一键式模型部署和提供硬件优化的函数库)和硬件加速模块(利用特殊硬件技术提高计算效率)。
执行层:将交易决策转换为实际订单,通过服务器部署和软件硬件加速技术降低交易延迟,包括传输延迟和计算延迟。
分析层:监控投资策略执行,包括事后风险控制模块(进行回报和风险归因)和事后 XAI 模块(从 AI 角度解释策略行为,进行风险分析和可视化)。
LLMs 的潜力与技术
监督微调(SFT):在特定任务上微调预训练的 LLM,以适应量化投资任务。
提示工程:设计合适的提示,引导 LLM 生成符合需求的输出,如在量化投资中生成投资策略或分析市场趋势。
检索增强生成(RAG):结合外部知识源和 LLM,提高生成内容的准确性和相关性,例如从金融数据库中检索信息辅助 LLM 进行股票预测。
LLMs 在量化金融的潜力:LLMs 如 GPT - 4、LLaMA 等在许多领域展现智能能力,在量化金融中也有潜在应用价值,可通过监督微调、提示工程和检索增强生成等技术整合金融领域知识。
相关技术介绍
LLMs 在量化投资中的角色
量化副驾驶:如 Alpha - GPT,能理解量化意图,通过自然语言交互发现 “好” 的 alphas,提高量化研究效率,充当人与量化管道的中介,简化工作流程。
金融分析师:像 ChatGPT 等可根据优化提示评估新闻情绪,判断股票买卖时机,BloombergGPT 通过大规模金融语料库预训练,在金融相关任务中表现出色,为交易决策提供见解。
特征工程师:LLMs 可将输入数据编译为潜在 “特征”(嵌入),用于下游量化预测任务。例如,Ding 等利用 LlaMA - 7B 嵌入金融新闻,通过注意力机制为个股生成嵌入,用于预测股票回报。
计算能力需求增长:GPU 和并行计算技术发展使 AI 模型规模增长,Quant 4.0 依赖超大规模计算力,面临计算成本高的问题。未来可研究更快算法、在线学习和大规模预训练等方向,以满足 Quant 4.0 对计算能力的需求。
另类数据技术:另类数据为量化研究提供更广阔空间,但存在数据采集困难(因知识产权和隐私保护)和聚合困难(数据异构)的问题。可研究数据资产所有权证书、加密、联邦学习技术及更好的数据挖掘技术,以解决这些问题。
金融知识工程:知识驱动 AI 在量化金融中重要,需研究新的知识表示方法、构建可靠知识库和开发高效知识推理算法。未来要解决知识工程应用前的技术难题,如更复杂的知识表示、先进的知识管理系统和下一代推理算法等。
金融元宇宙和世界模型模拟器:构建金融元宇宙可模拟市场情况,但面临细粒度数据收集和高精度模拟计算力需求的挑战。技术实现需解决数据和计算资源等方面的问题,以更好地理解金融市场微观结构和逻辑。
认知 AI 和因果工程:认知 AI 是 AGI 方向之一,因果推理和机器学习是实现 AGI 的潜在路线。在投资中理解因果关系困难,可通过因果工程构建因果图数据库,存储和管理变量间的因果关系,以解决投资中因果关系分析的难题。
AI 风险图和系统建模:金融大数据增长促使构建 AI 风险图,用于不同层次维度的金融风险建模,通过计算条件风险概率系统建模风险。还需考虑非线性风险测量,以更全面地评估投资风险。
时空建模:传统股票策略沿时间或股票轴开发,各有局限。可将横截面建模和时间序列建模融合在统一框架,应用时空数据挖掘技术,发挥两者优势,提高量化模型的有效性和适应性。
通用建模:大规模预训练模型在 AI 中有效,有潜力应用于量化场景,但存在信噪低和未来信息潜在泄漏等困难。预训练 - 微调范式可迁移到量化场景,但需解决相关问题,以提高模型性能和泛化能力。
稳健建模:量化建模中稳健性重要,可通过因果效应建模探索因素与决策的因果关系、持续学习技术提高模型泛化能力、模型集成技术(如 bootstrap 聚合、提升、堆叠、贝叶斯模型平均)提高预测稳定性、模型随机化等方法增强集成模型多样性以及多模态学习整合多样化数据等方式,提高模型的稳健性。
端到端建模:传统量化研究管道步骤多且优化目标不同,构建端到端模型有难度,因缺乏明确监督信号、各步骤频率差异、信噪低和计算力要求高。可从强化学习框架基线模型入手,关注数据、因素、决策和执行在多时间粒度的融合,探索端到端建模的可行性和优化方法。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-06-20
2024-07-03
2024-06-14
2024-06-06
2024-06-14
2024-06-21
2024-06-07
2024-06-16
2024-07-21
2024-07-01
2024-11-19
2024-11-06
2024-10-25
2024-10-25
2024-10-25
2024-10-18
2024-10-09
2024-10-07