AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


华泰金工 | Deepseek+投研:大模型应用集锦

发布日期:2025-03-01 05:43:03 浏览次数: 1738 来源:华泰证券金融工程
推荐语

大模型时代来临,DeepSeek投研应用引领潮流。

核心内容:
1. DeepSeek在投研领域的信息提取与分析能力
2. DeepSeek犀照和DeepSeek-Researcher的应用案例
3. DeepSeek在后GPT时代的开源与后训练优势

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
大模型的发展超乎想象般的高歌猛进、高潮迭起,大模型时代似乎逐步朝“后GPT时代”迈进,“后GPT时代”围绕两个核心关键词运转:后训练与开源。DeepSeek则是这两个关键词的代表案例,有望进一步带动大模型投研应用风潮本文深入探索DeepSeek投研应用的潜在案例,涵盖了从个股技术分析到报告自动生成等诸多方面,充分展示了DeepSeek在信息提取、检索、融合、分析、生成等方面的卓越潜力。此外,本文还介绍了两个基于Agent框架的DeepSeek投研应用,即DeepSeek犀照和DeepSeek-Researcher,进一步拓展了DeepSeek在投研领域的应用边界,以期带来启发。

核心观点

人工智能88:基于DeepSeek的大模型投研应用集锦
本文是DeepSeek投研应用的案例集锦,探索DeepSeek与投研结合下可能带来的效率提升。从模型特性上看,DeepSeek占据优势,成本与效果兼优,同时具有开源属性,贴合投研机构应用需求。从具体案例上看,DeepSeek展现出优异的信息提取、检索、融合、分析、生成等能力,或可成为投研场景下的不可或缺的辅助工具。

后GPT时代与突围者DeepSeek
在大模型发展浪潮中,从ChatGPT到众多模型如DeepSeek-R1等不断更新迭代。我们认为,后GPT时代以“后训练”与“开源”为关键词。DeepSeek是这两个关键词的代表案例,对于后训练,其DeepSeek-R1-Zero基座模型在训练中展现魅力“aha moment”(顿悟时刻),而DeepSeek系列模型也持续保持着开源传统。对于投研领域而言,DeepSeek性价比颇高,亦可内部部署,具备诸多优势,有望带动投研应用风潮。

基于DeepSeek的投研应用全景
本文尝试构建6项DeepSeek投研应用,涵盖投研日常工作的各个方面。“个股技术分析”应用提供自动化、批量化的个股分析,可作为技术角度下的个股风险提示或量化策略使用;“报告梳理汇总”对于日常报告整理、降低阅读负荷或大有帮助;“基金季报信息提取”展现DeepSeek+RAG下的信息提取和文本分析效果;“新闻舆情分析”着重体现DeepSeek情感分析能力;“研报观点融合”也是展现DeepSeek文本分析汇总能力的应用;“报告自动生成”真正展现出DeepSeek的文本生成能力,或将大大提升投研报告撰写效率。

DeepSeek+Agent赋能投研
大模型作为帷幄之中的运筹者,真正决胜于千里之外是Agent。本文尝试在扣子平台和Dify平台分别构建Agent应用案例。以扣子平台为例,我们构建一个名为DeepSeek犀照的智能体,用于概念股捕捉,其核心组件是一个具有上网检索概念新闻、提取概念股功能的工作流,以该工作流为基础,DeepSeek犀照能够有效完成特定概念股的检索,并列示概念关联理由。Agent对大模型能力边界的补充,或亦将成为构建投研应用的利器之一。

正    文

01 导读

ChatGPT的推出引发了大模型时代的浪潮,DeepSeek模型使得这波浪潮愈加汹涌澎湃。从大语言模型的发展历程上看,大模型能力的提升似乎并未像想象中的跌宕起伏,反而是高歌猛进、高潮迭起。ChatGPT、GPT-4、Claude-3.5、Gemini-1.5、OpenAI-o1、DeepSeek-R1等模型纷纷篆刻下属于自己的历史节点,用独特的路径革新旧的训练范式、超越旧的语言模型。大模型技术似乎在循着难以预料的科技树分支前进,时代中人或许缺乏着对未来的想象。


后GPT时代的大语言模型:后训练与开源
随着诸多大模型开发团队对大模型技术的探索和深挖,大模型时代似乎逐步朝“后GPT时代”迈进。前GPT时代以预训练(Pre-Training)阶段Scaling Law(规模法则)为信仰,通过堆叠参数量,提升大模型效果,后GPT时代则围绕两个核心关键词运转:后训练与开源。

后训练(Post-Training)指预训练后的训练,包括持续预训练(Continued Pre-training)、任务/领域自适应训练、知识蒸馏,以及结合强化学习技术(如PPO、DPO)对齐人类偏好。以InstructGPT和Llama3.1为代表的两个大模型时代,后训练手段已经出现明显差异,人类偏好数据、RLHF、数据增强正在成为新的共识。


对于大模型开发者而言,开源成为一种卓越的策略,一种由LLaMA和DeepSeek切实证明了的快速获得全球影响力的策略。从LLaMA家族中可以看出,专用模型、垂域模型开枝散叶,LLaMA模型的隐形影响力不可小觑。与此同时,开源策略在当前时点,无疑为用户提供了诸多红利。


DeepSeek:深度思考与“开源之光”
DeepSeek是“后GPT时代”两个关键词的代表性案例。对于DeepSeek-R1的基座模型DeepSeek-R1-Zero而言,在强化学习训练阶段,随着训练阶段的递进,模型平均响应长度在稳定变长,DeepSeek-R1-Zero自主学习到使用更长的思考时间来解决推理任务(“DeepSeek-R1-Zero naturally learns to solve reasoning tasks with more thinking time”)。此外,DeepSeek-R1-Zero还出现了“aha moment”,也即DeepSeek-R1-Zero学会了通过重新评估其初始解决方案,以分配更多的思维时间解决问题。后训练的魅力时刻在这里充分显露出来。


DeepSeek系列模型维持了充分开源的传统。以DeepSeek-V3为例,我们可以通过模型原始文件得到清晰的模型架构图,包括DeepSeek MoE、Multi-head Latent Attention等自研特色架构与技术。开源的DeepSeek模型将与LLaMA模型一样,在不同的垂域发展变体及应用,例如投研领域。


DeepSeek+投研=?
DeepSeek与投研结合具备诸多优势,优势之一在于物美价廉。以DeepSeek-V3为例,其API定价约为同类竞品的十分之一以下。以MMLU Redux ZeroEval Score数据集(测试模型多任务语言理解能力)为比较基准,其得分高于GPT-4o和Claude 3.5 Sonnet,显示出其优异性能。

DeepSeek的另一核心优势在于开源,这意味着机构可以轻而易举将DeepSeek模型部署至机构内部环境,既能在模型层面实现个性化优化与改造,又可防止信息泄露等潜在风险。综合以上优势,DeepSeek的火爆或将在投研领域带动一股风潮。


02 基于DeepSeek的投研应用全景
本文尝试对DeepSeek的投研应用进行探索,分别设计测试6个常规大模型应用和2个Agent应用,涉及信息提取、检索、融合、分析、生成等方面。从测试案例上看,DeepSeek模型兼顾效果与成本,是金融场景下投研应用的较优选择。

应用一:个股技术分析
技术分析是最流行的股票分析技术流派之一,为个股趋势判断、风险研判提供了参考。然而,技术分析较为灵活,分析时影响因素众多,人工技术分析费时费力。因此我们基于DeepSeek-V3模型构造个股技术分析应用,为快速、批量进行个股技术分析提供解决方案。

在该应用中,我们通过提示工程技术为DeepSeek-V3输入多样化的个股技术指标,例如SMA、EMA、MACD、RSI等,DeepSeek-V3将基于这些指标进行逐一分析并汇总,最终输出相应技术分析报告。


在技术分析报告中,为提升可读性,我们在各项技术指标分析内容之后嵌入指标图表,便于对比大模型分析内容与图表。从测试案例上看,DeepSeek-V3能够较为专业地对各项技术指标进行分析,同时给予明确地投资建议。


应用二:报告梳理汇总
大模型或将提升研究员信息处理效率、增加信息摄取密度。投资市场每天的海量研报极大增加了研究员的阅读负荷,研究员则常常着重关注报告中的个别图表。我们针对这一场景设计了基于DeepSeek的研报梳理汇总应用,以期此类应用能够降低研究员的阅读负担、提升投研工作效率。

为达到准确定位信息的目的,我们以图表为锚,确认关键信息位置,进而获取图表上下文。DeepSeek在此应用发挥的核心作用是对图表上下文信息进行整合,达到信息汇总的效果。最终,我们将图表截图与大模型整合内容汇总,拼接成研报精华集锦


从测试结果上看,基于DeepSeek-V3模型,我们能够准确汇总多篇报告内容,将关键信息集合到单个报告之中。通过对海量报告的自动化信息提取,该应用能够大幅降低研究员整理报告信息的精力消耗,并有潜力应用于各类信息梳理汇总的场景,例如路演、会议总结场景。


应用三:基金季报信息提取
对于个人投资者及FoF策略研究者而言,相较于日常能够获取的基金净值等信息,基金定期报告中披露了更多重要信息,尤其是基金经理对于产品既往表现的分析、以及对未来市场的展望,这部分内容可能潜在显露了基金经理之后的投资风格,对于基金产品分析大有裨益。

作为基金产品少有的另类文本数据,基金经理分析展望文本已被研究者广泛探索,随着以DeepSeek为代表的大模型浪潮涌现,对此类文本的分析工具将进一步进化,从而实现更复杂的分析、更精准的应用效果。本文基于LightRAG技术,对PDF格式的基金季度报告进行信息抽取和额外分析,帮助提供更为深入的基金剖析与研判。

LightRAG是Guo et al. (2024)提出的知识增强语言模型,相比于传统的RAG技术(参考前期报告《“GPT如海”:RAG与代码复现》(20240506)),它通过整合图结构和双级检索策略来提高信息检索与生成的准确性和效率。因此,本案例在LightRAG模型的支持下,或能从基金季报中捕捉更为丰富的信息,辅助基金产品分析。


在本应用框架中,我们首先提取基金季报PDF文件中的文本信息,将文本信息输入LightRAG中,LightRAG将自动提取文本中的实体及关系信息,保存至向量数据库中。向模型提问时,我们使用具备深度思考能力的DeepSeek-R1模型,多层次检索获取的实体、关系、文本信息将被DeepSeek-R1通览,最终生成回答。


我们展示该应用的两个使用案例。第一个案例是对某基金经理分析展望文本进行剖析,DeepSeek-R1能够较准确地总结原文,并对核心信息加粗以凸显重要性,例如“基本面多因子量化选股策略”,“谨慎乐观”,“回归基本面逻辑”。与此同时,DeepSeek-R1能较为专业地利用已有信息对基金经理进行未来投资偏好预测,DeepSeek-R1从三方面进行预测:因子配置侧重、行业关注方向和风险管理特征,以因子配置侧重为例,DeepSeek-R1认为可能加大价值因子权重,同时维持成长因子配置。

第二个案例是对原文表格数据的提取,我们提问DeepSeek-R1“报告期末基金资产组合中权益投资的金额是多少”,DeepSeek-R1能完全准确地定位原文信息和数据,回复“基金资产组合中权益投资金额为51,980,511.62元,占基金总资产的比例为92.63%。”


应用四:新闻舆情分析
新闻舆情分析一直是投研场景下具有重要价值的分析手段之一。在预训练阶段,大模型的海量知识主要来源于文本,也意味着大模型是天生的文本分析高手。DeepSeek系列模型诞生在中文环境下,相比其他海外开源/闭源模型可能具备更高水平的中文文本分析能力,因此,我们使用DeepSeek-V3与DeepSeek-R1模型探索其新闻舆情分析能力。

主体识别和关系抽取是探索方向之一。我们将原始新闻输入DeepSeek-V3模型,逐步要求其完成两项任务:一项是识别新闻中涉及的主体,从结果上看,DeepSeek-V3能够较完整地抽取出新闻涉及的主体,例如“果小美”、“51零食”、“猩便利”等;另一项是主体间关系抽取,DeepSeek-V3 能够有效抽取出主体间关系,同时按mermaid 格式(一种markdown格式)输出关联关系,例如:

D[腾讯] -->|领投| E[每日优鲜便利购]
           D -->|入股| F[永辉超市]
                            F -->|旗下| G[超级物种]

显示出DeepSeek-V3高效精准的信息提取能力。


另一方面,我们探索了DeepSeek模型对新闻的情感分析能力。为了能够获得充分合理的情感辨别理由,以及对隐含情感剖精析微地研判,我们使用DeepSeek-R1模型进行推理式情感分析。从输出结果上看,DeepSeek-R1在判断情感偏向的同时,可以给予短小精悍的情感分析理由,例如给予“腾讯”积极判断,理由是“领投每日优鲜便利购并入股永辉超市,积极布局新零售领域,战略意图明确,体现对行业的信心。”此外,DeepSeek-R1可以按json格式输出结果,便于批量化情感分析。


应用五:研报观点融合
分析师一致预期策略是投资市场中最为人熟知的策略之一。在研究报告浩如烟海的背景下,如何准确快速地提取分析师研报观点,逐渐成为权益及量化研究者的关注点之一。华泰金工前期研究(如《再探文本FADT选股》(20221028))已经体现出研报内容隐藏的alpha,如今大模型的文本分析能力或将比Bert模型更胜一筹,将其应用于研报观点融合场景下便自然而然了。

从方法论上看,该应用的痛点之一在于研报数量过多,直接输入大模型并不可行(DeepSeek-V3和DeepSeek-R1的上下文窗口上限均为64K,约10万字)。我们的解决方案是利用DeepSeek-V3模型逐篇阅读报告,随后生成摘要,将摘要汇总至DeepSeek-R1,使其进行研报观点融合。从效果上看,该方案有效避免了上下文溢出,同时DeepSeek-R1的确呈现出完善的观点汇总能力,从“行业现状”、“未来预测”以及“核心结论”角度综合研报观点。


此外,我们尝试使用DeepSeek-R1生成研报观点融合网络。所谓研报观点融合网络,在此场景下指观点的逻辑序列,主要包含事件、背景和由此引发出的观点与结论。在以下示例中,DeepSeek-R1根据原始研报内容,由“春节消费整体向好”引发出“白酒行业表现”、“乳制品礼赠需求”、“休闲零食量贩业态”等讨论,最终获得相应的投资建议和风险提示,更为清晰地呈现出多篇研报中蕴含的逻辑流,从而获得更具可视化效果的观点呈现。



应用六:报告自动生成
报告撰写一直是投研场景下最为核心的任务之一,大模型基于海量文本数据训练而来,已然具备较高的报告辅助生成的潜力。为此,我们构建基于DeepSeek-R1的报告自动生成应用框架,在该框架中,我们将与报告相关的图表图片作为输入,由多模态大模型输出图片描述,基于图片描述,DeepSeek-R1将生成不同章节,最终可拼接成完整报告。

具体而言,虽然DeepSeek多模态版本模型DeepSeek-VL业已问世开源,但不便于通过云端API访问,因此我们使用GPT-4o模型替代,对不同图表进行详细描述。随后,我们将图表1-3划分至章节1,图表4-8划分至章节2,由DeepSeek-R1利用这些图表信息分别生成两个章节,并拼接成最终报告。值得强调的是,我们会在生成内容中预留图表位置,以便插入图片,形成图文并茂的报告。


从报告生成效果上看,DeepSeek-R1能够生成一篇质量颇高的报告。对于标题,DeepSeek-R1生成的一个例子是“全球权益资产领涨市场,技术面超买信号提示短期波动风险”,体现出一定程度的专业性;对于内容,DeepSeek-R1也能够生成富有逻辑甚至颇具思考的段落,例如“值得关注的是,港股市场表现尤为亮眼,恒生指数周涨幅达7.04%,在全球主要股指中拔得头筹,这或与外资持续回流新兴市场及估值修复逻辑共振有关。”


03 Agent框架下的DeepSeek投研应用
大模型如柴,Agent如火。在大模型时代浪潮下,以Agent为代表的应用框架正在使大模型触达诸多垂域角落。大模型与Agent具有相当程度的互补性,大模型缺乏对外部环境的感知和操作工具,而Agent渐渐成为能近乎完美地补全这些劣势的框架。因此,在实际的大模型应用开发中,往往呈现这样的局面:大模型作为帷幄之中的运筹者,真正决胜于千里之外是Agent。于是在投研场景下,我们也尝试进行以下Agent应用的探索。

扣子:DeepSeek犀照
我们使用扣子平台探索第一个Agent应用:DeepSeek犀照,用于概念股捕捉。扣子平台(www.coze.cn)是字节跳动推出的一站式AI开发平台,帮助用户填补从大模型到应用场景的最后一公里。在扣子平台上,用户可以零代码实现自己的大模型应用,并可便捷发布到扣子商店、豆包及微信公众号等多项平台。

在DeepSeek犀照应用的实现过程中,最大的难点在于如何自动化搜集整理概念股信息,我们尝试使用工作流完成该任务。我们为DeepSeek犀照Agent构建了一个名为hot_concept_stock_search的工作流,该工作流基本遵循以下步骤:关键词提取→新闻搜索→新闻主体及概念关联理由提取→上市公司鉴别→格式化输出。

具体而言,用户提出特定概念股搜寻的需求,由DeepSeek-V3模型进行概念关键词提取及扩充,随后利用搜索插件(bingWebSearch)对概念关键词相关新闻进行新闻检索,对于检索出的新闻,我们使用DeepSeek-R1模型进行深度推理,提取新闻中涉及的公司主体及与概念关联理由。至此,概念股提取已基本完成,唯一的问题在于新闻中涉及的公司主体并非全为上市公司。所以在其后,我们额外增加了知识库检索的步骤,在知识库中插入当前所有上市公司名称,由DeepSeek-V3逐一判断新闻公司主体是否为上市公司,最后,我们对公司名称、概念关联理由、是否上市三项信息构建格式化输出,获得最终工作流输出。


上述工作流作为DeepSeek犀照Agent的核心组件,基本实现了热门概念股捕捉的功能。在Agent构建界面中,我们也适当调整了提示(Prompt),即下图中的“人设与回复逻辑”,以保证Agent能够严格复制工作流的输出。此外,本应用未设置插件、数据库、长期记忆等附加功能,实际这些功能在很多场景亦能发挥特定作用,值得探索与尝试。


我们提问DeepSeek犀照“搜索一下deepseek相关概念股”,用以测试。从测试结果上看,DeepSeek犀照能够迅速调用工作流,对相关概念股进行自动化搜集,同时遵循特定格式输出概念股表格信息,基本实现了特定概念股捕捉的功能。


Dify:DeepSeek-Researcher
相比于扣子补充的“最后一公里”,开源的Dify平台更好地匹配了机构内部部署的需求。Dify平台由苏州语灵人工智能科技有限公司开发,作为一款开源的LLMOps(Large Language Model Operations,大语言模型运维)平台,Dify能够帮助用户快速创建可视化、可运营的AI应用。Dify的本地部署可参考华泰金工前期报告《大模型本地部署手册》(20241007)。

Dify平台提供了丰富且专业的大模型应用模板,我们以“GPT-Reasearcher EN”为模板,尝试构建一个DeepSeek-Researcher应用,主要功能是围绕特定主题生成研究报告。该应用接受研究主题为输入,如“DeepSeek+投研=?”,从主题中提取、扩充关键词用于互联网资料检索,随后由检索工具(TavilySearch)反馈检索结果给后续的大模型,最终基于模板生成完整的研究报告。


扣子与Dify这类LLMOps平台与低代码平台存在类似之处,基本都提供了运行流程跟踪功能,便于解决报错。以Dify平台为例,当我们在编辑页面试运行DeepSeek-Researcher后,可以从流程追踪界面检查每个节点的输入输出,对于工作流优化、报错定位解决等极有帮助。


我们以“DeepSeek+投研=?”作为研究主题输入,测试DeepSeek-Researcher功能。从运行结果上看,DeepSeek-Researcher能够结合庞杂资料,快速生产出一篇合乎主题的研究报告,总体质量出色。

风险提示:

大模型是海量数据训练获得的产物,输出准确性可能存在风险;不同大模型效果存在差异,需谨慎选择;非本地大模型处理敏感数据或有信息泄露风险。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询