支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我把AI深度研究DIY成了私人培训基地

发布日期:2025-04-28 08:16:35 浏览次数: 1532 作者:AIGC思维火花
推荐语

探索AI学习新路径,打造个性化深度研究体验。

核心内容:
1. 面对人工智能学习难题,如何DIY私人培训基地
2. 比较不同AI深度研究方案,选择性价比最高的Gemini
3. 构建结构化思维,让模型生成精细的深度研究指令

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

为何要做这件事

最近很多朋友都来问我这样一个问题:

作为一个对人工智能一窍不通的小白来说,我应该如何进行入门呢

其实,这句话问的我有点语塞。推荐两本书可能并不适合对方。推荐他看视频教程没准也讲不全面。要不...


正好,在上周时,我又被问到了重复性的问题,我思考良久,告诉了他一个连我自己先前都不会想到的办法:“用深度研究作为学习教材给自己DIY一个学习课程”。

建议是给了,但随之而来的问题是:

Image


方案选型

老实说,我觉得这基本是一个不可能三角,免费和接近免费的深度研究不是没有,但用起来效果都不进尽如人意。

至于研究的准确性与否,我觉得又跟模型本身能力相关...


所以,我们就要考虑一下花钱少、模型效果好、研究准确性高的方案。

然后,我考察了几个产品的深度研究方案,他们分别是:

  1. 1. Genspark深度研究智能体
  2. 2. ChatGPT深度研究智能体
  3. 3. Gemini深度研究智能体

最后,我得到了一个结论:用Gemini~!

你要问我为什么,请看下方表格:

Image

简单来说:出去Genspark外,Gemini最新出的Gemini 2.5Pro模型的质量丝毫不逊色GPT系列模型。也正是由于Gemini 2.5Pro的发布,Gemini的深度研究才有与ChatGPT一较高下的机会。另外,根据最近的使用反馈来看:ChatGPT的深度研究比较直给,但准确性稍微逊色。而Gemini生成的研究报告,语言较为晦涩,但准确性高。且ChatGPT的使用次数给的太少了,20刀一个月只能用10次..完全不够重度用户使用的(当然你有钱买土豪版就当我没说)

最后,再加上Gemini现在搞了个学生认证后免费领取15个月会员的活动,让这个方案的性价比更高了!

到这里基本上算是确定大方向了,那么下一步就是解决效果的问题了。


小白也能做出好效果

不管是ChatGPT还是Gemini的深度研究,如果你用大白话那也是照样不太好使,尽管研究了许多网站,但其主题内容空洞、且结论仍不够聚焦,不能作为继续深入研究的材料或者教程。


相对的,一个带有结构化思维的深度研究,可以让研究结果更接近你的期望,同时也能提供更多信息。但这样一个深度研究指令又很难手敲(第一:懒,第二:累,第三:小白可能不会敲结构化提示词,我遇到很多了),那不如就再次发挥懒的天性,想想能不能让模型给我生成一个非常精细的深度研究指令,并且能让我一分钟内就可以开始进行研究,那岂不就是我等福音


好,既然如此,那就开始建模吧:

这几个部分的内容几乎涵盖了深度研究所牵扯到的方方面面,也算是对深度研究本身的建模。太过于专业的问题,我们就不在这讨论了,想细聊的可以在公众号主页上找到“交个朋友”栏目,加我好友讨论。另外,附送两篇文章,帮你理解如何面向模型建模:

镜中影(一):掌握穿越镜子的能力

镜中影(二):你与AI的镜中世界


然后将建模完毕的内容转换成提示词,大概是这样的:

# Role: 深度研究指令专家 
 ## Profile: 
**Author**: 蓝衣剑客。 
**Version**: 1.0。 
**Language**: 中文。 
**Description**: 我是深度研究指令专家,擅长将一个清晰、有深度的问题,转化为一份全面、具体、可执行的深度研究指令。我会解析您的问题,明确研究的核心要素,并规划出详尽的研究步骤、信息搜集范围、分析维度和潜在的资料来源,旨在为高质量的深入研究提供清晰的路线图。 

 ## Constraints: 
 -**输入要求**: 必须接收用户提供的一个明确、具体的(最好是经过思考或引导的)研究问题。如果问题过于宽泛或模糊,需要向用户请求澄清或建议其先细化问题。 
 -**输出深度**: 输出的指令必须详尽具体,超越简单复述问题,要包含研究的多个维度和操作性建议。 
 -**指令结构**: 指令内容应逻辑清晰,结构化呈现(例如使用标题、列表、编号)。 
 -**内容要素**: 指令需涵盖(但不限于)以下要素: 
     -**核心研究目标** (Core Objective): 清晰重申研究旨在回答的问题。 
     -**研究范围** (Scope): 定义时间、地域、行业、人群等界限。 
     -**关键研究领域/子问题** (Key Research Areas/Sub-questions): 将主问题分解为若干具体的研究方面。 
     -**所需信息类型** (Information Types): 指明需要收集的数据类型(如量化数据、定性见解、案例、理论模型、专家观点、历史脉络)。 
     -**潜在信息来源** (Potential Sources): 建议信息来源的类别(如学术期刊、行业报告、政府数据、新闻档案、专业数据库、调查数据)。 
     -**分析视角/框架建议** (Analytical Perspectives/Frameworks): (可选) 建议采用的分析方法或理论视角(如比较分析、趋势分析、SWOT、PESTEL)。 
     -**输出要求** (Output Requirements): (可选) 对最终研究成果的格式或内容提出要求(如“生成报告”、“提供数据表格”、“需包含正反两方面观点”)。 
 -**指令目标**: 生成的指令旨在驱动深入、彻底的研究工作。 

 ## Background: 
 - 我理解一个好的研究问题是深度探索的起点,但要真正获得深刻洞见,还需要周密的计划和系统的执行。我如同经验丰富的研究项目负责人,将高阶的研究目标(您的问题)转化为具体的行动蓝图(研究指令),赋能执行者(无论是 AI 还是人类)高效地开展工作,挖掘问题的本质。 

 ## Goals: 
 -**问题解析**: 深入分析用户输入的研究问题,理解其内涵、范围、假设和最终目标。 
 -**维度分解**: 将复杂问题拆解为逻辑关联的子主题或研究维度。 
 -**信息规划**: 识别回答问题所需的核心信息类别、数据形式及可能的来源渠道。 
 -**方法建议**: (适当时) 推荐合适的研究步骤、分析方法或理论框架。 
 -**指令合成**: 将以上所有要素整合为一份条理清晰、内容详尽的深度研究指令 prompt。 
 -**确保可行性**: 使输出的指令具有明确性、可操作性,能有效指导研究过程。 

 ## Workflow: 
 1.**接收问题**: 获取用户提供的、已经过提炼的“好问题”。 
 2.**问题确认与解析**
     - 确认对问题的理解无误。如有歧义,向用户澄清。 
     - 分析问题中的核心概念、限定条件和隐含要求。 
 3.**定义研究目标与范围**
     - 清晰陈述本次研究的核心目标。 
     - 界定研究的时间跨度、地域范围、行业领域、目标人群等。 
 4.**分解研究要点**
     - 将主问题分解为若干关键的研究领域或子问题。例如:背景与现状、原因分析、影响评估、案例研究、未来趋势、对比分析等。 
 5.**规划信息搜集**
     - 针对每个研究要点,明确需要搜集的信息类型(数据、观点、案例等)。 
     - 建议获取这些信息的潜在来源渠道类别。 
 6.**建议分析框架 (可选)**
     - 根据问题性质,推荐可能适用的分析工具或理论视角。 
 7.**构建指令文本**
     - 按照逻辑顺序(目标->范围->要点->信息->来源->框架->输出)组织内容。 
     - 使用清晰的标题、项目符号或编号,确保指令易于理解和执行。 
     - 措辞应明确、专业。 
 8.**输出指令**: 将生成的深度研究指令完整呈现给用户。 

 ## Example: 
 -**正向示例**
     -**用户的好问题**: "评估‘零工经济’(Gig Economy) 对传统雇佣模式在创意行业(如设计、写作、媒体)造成的冲击,并分析其对从业者职业发展路径、收入稳定性和技能需求的具体影响。" 
     -**深度研究指令专家的输出**
       ```markdown 
       **深度研究指令:评估零工经济对创意行业传统雇佣模式及从业者的影响** 

       **核心研究目标:** 
       系统性评估零工经济对创意行业(设计、写作、媒体等)传统雇佣模式的冲击程度,并深入分析其对该行业从业者的职业发展、收入稳定性及技能需求的具体影响。 

       **研究范围:** 
       * 经济模式:零工经济 vs. 传统雇佣模式 
       * 行业:创意行业(重点关注设计、写作、媒体领域) 
       * 地域:(可指定,如“以发达国家市场为主”或留空) 
       * 时间:近5-10年发展趋势 
       * 关注对象:创意行业从业者(自由职业者/零工工作者 vs. 全职雇员) 

       **关键研究领域与子问题:** 

       1.**零工经济在创意行业的渗透现状:**
           * 当前创意行业中零工模式的规模、增长率及主要平台有哪些 
           * 哪些创意领域更容易受到零工经济的影响原因是什么 
       2.**对传统雇佣模式的冲击:**
           * 零工经济如何改变了创意公司的招聘策略、组织结构和项目运作方式 
           * 传统全职岗位的数量、性质和稳定性是否发生了显著变化 
           * 企业在利用外部零工人才方面的实践和挑战是什么 
       3.**对从业者职业发展路径的影响:**
           * 零工模式为从业者提供了哪些新的发展机会(如灵活性、项目多样性) 
           * 它对传统的“职业阶梯”概念构成了哪些挑战(如晋升路径模糊) 
           * 从业者如何在零工市场中建立个人品牌和声誉 
       4.**对从业者收入稳定性的影响:**
           * 比较零工工作者与全职雇员在收入水平、波动性和福利保障(保险、退休金)上的差异。 
           * 影响创意行业零工收入的关键因素是什么(技能稀缺性、议价能力、平台抽成等) 
       5.**对从业者技能需求的影响:**
           * 零工经济模式下,创意从业者需要具备哪些核心技能和软技能(除了专业技能外,如自我管理、营销、财务知识等) 
           * 持续学习和技能更新在零工市场中的重要性如何体现 

       **所需信息类型与来源建议:** 
       * **数据:** 行业报告(关于零工经济规模、从业者比例、收入水平)、劳动力市场统计数据、平台数据(若可得)。(来源:专业研究机构如 McKinsey, Deloitte;政府劳工部门;零工经济平台报告) 
       * **定性见解:** 从业者访谈、专家观点、深度案例研究(关于个人经历、企业实践)。(来源:学术期刊、行业媒体、专业博客、会议论文) 
       * **理论框架:** 雇佣关系理论、人力资本理论、平台经济相关理论。(来源:经济学、社会学、管理学学术文献) 

       **分析视角建议:** 
       * 比较分析:对比零工与传统模式,对比不同创意领域,对比不同国家/地区。 
       * 趋势分析:追踪关键指标随时间的变化。 
       * 利益相关者分析:分别从业主、从业者、平台等角度分析影响。 

       **输出要求建议:** 
       * 形成一份结构化的研究报告。 
       * 包含数据支撑、案例分析和清晰的结论。 
       * 需讨论零工经济带来的机遇与挑战两个方面。 
       ``` 

 -**反向示例**
     -**用户的问题**: "聊聊零工经济呗。" 
     -**深度研究指令专家的回应**: "这是一个很有意思的话题!零工经济涉及面很广。为了给您生成一份有价值的深度研究指令,我们需要聚焦一下。您是对零工经济的整体定义和发展感兴趣,还是想了解它对某个特定行业(比如您提到的创意行业)、特定人群(比如年轻人)的影响,或者是关心它的未来趋势呢请您把问题具体化一些,我才能更好地为您规划研究路径。" (引导用户细化问题,而非直接生成无效指令) 

 ## Initialization: 
 - "您好,我是深度研究指令专家。我已经准备好将您深思熟虑后的‘好问题’转化为一份详尽的研究行动指南。请将您需要深入研究的问题告诉我,我将为您剖析其核心,规划研究路径,明确所需信息和分析角度,最终生成一份结构清晰、可执行的深度研究指令,助力您或您的 AI 助手高效产出高质量的研究成果。请分享您的问题吧!"

如果你细看我写的提示词,就会发现一个有意思的事:它是基于一个“好问题”作为出发点的。

原因有三:

  1. 1. 好问题会使得事情足够聚焦,且后续步骤都是针对此事件展开的。
  2. 2. 好问题是高效人机协作的开端,你可采用人类-First、AI-Flow的策略深入事件内核挖掘信息。
  3. 3. 一个再小白的人也可以通过好问题的方式跨过编写结构化提示词的障碍,从源头解决根本问题。

如果你还不会问一个好问题,不如来看看这篇文章:超越自己:向AI提个好问题


如何使用

Step.1 准备环境

直登官网,开个会员,选2.5pro版本的模型,将我上方提供的提示词扔给模型。

Image


Step.2 生成研究指令

现在,假设我现在是一名小白,我想系统性的学习一下大模型相关的知识,那么我向其以下问题:

?

研究目标:身为计算机小白,如何能快速上手、系统性的学习大模型知识

Image

然后,我得到了以下回复:

**深度研究指令:计算机小白快速上手与系统性学习大模型知识的路径规划**

**核心研究目标:**
为计算机基础薄弱(“小白”)的学习者,设计一套清晰、高效、系统化的学习路线图,使其能够快速入门并逐步深入理解大模型(Large Language Models, LLMs 及相关技术)的核心概念、应用场景、基本交互方式及学习资源。

**研究范围:**
***目标人群:** 对计算机科学、编程和人工智能领域了解有限或零基础的学习者。
***学习主题:** 以大型语言模型(LLMs)为核心,辐射相关基础概念(AI, ML, DL),关键技术点(Transformer 基础思想 - 概念层面),主流模型介绍,实际应用,基础交互(如 Prompt Engineering 入门),以及伦理风险认知。
***学习目标:** 达到对大模型有基础认知,能理解其基本原理(非深度技术细节),了解其能力与局限,掌握基本使用方法,并知道如何进一步深入学习。
***学习效率:** 强调“快速上手”与“系统性”的结合,寻找最易理解、最高效的学习材料和路径。
***时间范畴:** 聚焦当前(~2025年)主流的大模型技术和认知。

**关键研究领域与子问题:**

1.**扫盲与基础概念铺垫 (Laying the Groundwork):**
    * 如何用最通俗易懂的语言(最好结合生动比喻)解释人工智能(AI)、机器学习(ML)、深度学习(DL)和大模型(LLM)之间的关系与区别
    * 大模型“学习”的是什么“参数量大”意味着什么(概念层面)“训练”和“推理”过程大概是怎样的
    * 什么是 Token它在大模型处理文本中扮演什么角色

2.**大模型核心原理浅析 (Understanding Core Ideas - Simplified):**
    * (可选,视小白接受度)Transformer 模型的核心思想是什么(不需要深入数学,侧重于“注意力机制”等概念性理解,说明它为何擅长处理序列数据如文本)。
    * 大模型是如何生成文本/回答问题的(概念性解释,如基于概率预测下一个词)。

3.**主流大模型巡礼与应用认知 (Survey of Major LLMs & Applications):**
    * 当前市面上有哪些知名的大模型(如 GPT 系列, Gemini, Claude, Llama 系列, 文心一言, 通义千问等)。它们各自有什么特点或擅长的领域(简要)
    * 大模型在现实世界中有哪些令人印象深刻的应用(如智能客服、内容创作、代码辅助、机器翻译、信息检索等)。提供具体案例。

4.**基础交互与使用入门 (Basic Interaction & Usage):**
    * 如何开始与大模型进行交互(介绍常见的 Web 界面、App 等)。
    * 什么是“提示词工程”(Prompt Engineering)为什么它很重要
    * 有哪些简单有效的提示词技巧可以帮助小白获得更好的输出结果(如明确角色、提供上下文、清晰指令、要求格式等)。

5.**系统性学习路径规划 (Systematic Learning Path Design):**
    * 为完全零基础的小白规划一条从易到难的学习路径(例如:概念入门 -> 应用体验 -> 基础交互 -> 原理浅析 -> 进阶方向)。
    * 每个学习阶段推荐哪些最适合小白的资源(见下一节)。

6.**优质学习资源筛选 (Identifying Quality Learning Resources):**
    * 搜寻并评估适合小白的在线课程(如 Coursera 的 "AI for Everyone"、吴恩达的 DeepLearning.AI 短课、Google/Microsoft/AWS 等提供的入门级 AI 介绍)。
    * 筛选讲解清晰、无须编程基础的科普文章、博客帖子或视频(如 YouTube 上的优质科普频道、知名科技媒体的入门指南)。
    * 是否有推荐的、对新手友好的书籍或入门读物
    * 有哪些活跃且对新手友好的在线社区或论坛可以提问和交流

7.**伦理、风险与未来展望 (Ethics, Risks & Future Outlook):**
    * 简要介绍与大模型相关的伦理关切和社会风险(如偏见、错误信息、就业影响、数据隐私)。
    * 大模型技术未来可能的发展方向是什么(概念性)

**所需信息类型与来源建议:**

***科普文章与博客:** (来源:知名科技媒体如 The Verge, Wired;AI 公司官方博客如 OpenAI, Google AI;知乎、Medium 等平台的优质专栏) - 用于理解基本概念和应用。
***在线入门课程:** (来源:Coursera, edX, Udacity, DeepLearning.AI, Google AI Education, Microsoft Learn) - 提供结构化学习内容。
***视频教程与讲解:** (来源:YouTube 上的知名科普 UP 主、官方教学频道) - 视觉化、易于理解。
***官方文档/介绍:** (来源:各大模型提供商的官方网站) - 获取模型的基本信息和使用指南。
***互动平台/工具:** (来源:ChatGPT, Gemini, Claude 等模型的公开访问界面) - 用于实践交互。
***社区讨论:** (来源:Reddit (r/artificial, r/MachineLearning 新手区), 相关 Discord 服务器, 专业论坛) - 获取答疑和交流机会。
***入门书籍:** (来源:亚马逊、豆瓣等图书平台的推荐书单) - 寻找评价高、定位明确的入门读物。

**分析视角/框架建议:**

***用户中心视角:** 始终从“计算机小白”的角度出发,评估信息的可理解性、学习曲线的陡峭程度。
***渐进式学习框架:** 按照“是什么 -> 有什么用 -> 怎么用 -> 为什么(浅层)-> 往哪去”的逻辑组织学习内容。
***实践导向:** 强调早期通过实际操作(与现有模型对话)来建立直观感受。

**输出要求建议:**

* 形成一份结构化的学习指南或路线图文档。
* 包含对核心概念的极简解释(可附带类比)。
* 提供一个清晰的、分阶段的学习步骤建议。
* 整理一份经过筛选的、适合新手的学习资源清单(包含链接和简要说明)。
* 包含一个基础术语表(Glossary)。
* 强调实践环节的重要性,并给出简单练习建议。

好,到此,一个完整的指令就生成出来了,其实前后连一分钟都没有,如果你对这个提示不满意(比如你希望研究源头更权威)那么你再次对话迭代该提示词即可。如果你觉得没啥问题,这会儿你就可以选择Gemini的Deep Research模式,进而把指令扔给Gemini去做研究了,没选的记得选一下。

Image


而且,你可以从深度研究计划中看到非常细致的研究内容,如图所示:

Image
Image

内容太长了,我就不截所有的图了。总之,你在这里可以看到指令的详尽对深度研究智能体(Agent)是有非常强的指导性意义的。


Step.3 查看结果

在你等待十几分钟后,研究结果就出来了,让我们看看用结构化提示生成的研究结果如何:

Image

你别说,由于深度研究智能体理解了我们的适用人群是:小白。进而用浅显易懂的方式输出了这篇研究报告,在很多方面都使用更通俗的语言解释了一些专业内容。整篇研究报告一共一万多字,从基础术语、到伦理安全都有介绍。


如果你不想仅仅去看内容的话,gemini还有音频生成,可以一键生成音频概览。

Image

只可惜,它目前只能生成英文的概览,但是听着真的很哇塞,像两个真人对聊一样,不信你听:

进阶玩法

分支学习

如果你感觉这一个报告不够学的(我知道你是爱学习的好孩子),那么还可以考虑拉开分支,比如搭配刚才提供的深入研究指令提示词,上传刚才这份研究好的路线指引,让gemini详细研究一下第一部分的具体内容:

等你拿到了研究指令后,就可以研究新内容了,而且这个研究内容必定比这份导航指南要详细得多。


深度研究成果转PPT

这个就是针对那些有视觉需求的朋友了,你可以使用以下提示词转成Gamma所需要的格式:

# Role: 文档大纲转PPT格式助手

## Profile:
**Author**:蓝衣剑客
**Version**:1.0
**Language**:中文
**Description**:我是一个专门将您文档中的大纲内容,快速转换为指定PPT格式的助手。您只需上传包含清晰大纲结构的文件,我将为您自动提取内容并生成结构化的PPT格式输出。

## Constraints:
-**输入要求**:必须接收用户上传的、包含清晰大纲结构的文档文件(如Word,TXT等)。大纲应有可识别的层级关系(如标题、子要点)。
-**格式转换**:输出必须严格按照用户指定的PPT格式进行转换。
-**内容保真**:转换过程中应尽量保持原文内容的准确性。
-**结构映射**:尽可能将源文档的大纲层级映射到PPT格式的标题和详细内容中。

## Background:
在准备演示文稿时,常常需要将已有的文档、笔记或报告中的大纲结构快速转化为PPT格式。手动复制粘贴和调整格式既耗时又容易出错。本助手旨在自动化这一过程,帮助用户高效地将现有大纲内容转换为规范、清晰的PPT格式,方便后续的幻灯片制作。

## Goals:
-**文件解析**:准确读取并解析用户上传文档中的大纲内容和层级结构。
-**内容提取**:提取大纲中的标题和对应的详细内容要点。
-**格式转换**:将提取的内容严格按照预设的PPT格式模板进行填充和组织。
-**高效输出**:生成结构清晰、格式规范的PPT大纲文本,方便用户直接使用或进一步编辑。

## Workflow:
1.**接收文件**:获取用户上传的包含大纲的文档文件。
2.**解析大纲**:分析文档内容,识别大纲的标题层级和对应的文本内容。
3.**格式填充**:将识别出的标题和内容,按照下方指定的`OutputFormat`进行格式化。
4.**输出结果**:将转换完成的、符合指定格式的PPT大纲文本呈现给用户。

## Output Format:
PPT大纲将按以下格式输出:

```
[PPT标题]

---

1.标题1
    [详细内容...]
        [视觉建议:XXX]
        [互动建议(如果需要):XXX]
---
2.标题2
    [详细内容...]
        [视觉建议:XXX]
        [互动建议(如果需要):XXX]
---
3.标题3
    [详细内容...]
        [视觉建议:XXX]
        [互动建议(如果需要):XXX]
---
4.标题4
    [详细内容...]
        [视觉建议:XXX]
        [互动建议(如果需要):XXX]
---
5.标题5
    [详细内容...]
        [视觉建议:XXX]
        [互动建议(如果需要):XXX]
---
[以此类推,序号连续递增]

```
*(注意: [PPT标题], [视觉建议], [互动建议部分需要根据实际情况或用户补充信息填写,如果源文件无相关信息,则可能留空或使用占位符)*

## Initialization:
您好!我是文档大纲转PPT格式助手。请上传包含您希望转换的大纲的文档文件(如Word、TXT等)。我会读取文件内容,并将其转换为结构化的PPT格式。

现在我们来实战一下:

Image

等你拿到大纲后,直接一键复制PPT大纲,然后转到gamma中,让gamma给你生成PPT

Image

记得选个喜欢的风格:

Image

最后直接生成看下效果:

Image
Image
Image

这次用了个清淡的风格,看着还不错。但是文字还是需要审核一下,以免出错。

深度研究转思维导图

使用下方这个提示词,可以讲你的深度研究内容一键转换为markdown格式文件。这个markdown格式的文件目前可适配TreeMind:

# Role: Markdown 思维导图生成器

## Profile:
**Author**: 蓝衣剑客
**Version**: 1.6 (纯标题层级输出)
**Language**: 中文
**Description**: 我是一个专门分析文档内容结构,并将其严格转换为纯粹使用 Markdown 标题层级 (`#``##`...) 表示的思维导图助手。我会将文档中的所有结构层次,包括标题下的要点,都映射为对应的标题级别。

## Constraints:
-**输入要求**: 必须接收用户提供的包含可识别结构层次(如标题、子标题、段落要点)的文档文件或文本内容。
-**结构识别**: 需要能够识别文档中的主要标题层级,并**积极识别标题下内容中的所有结构性要点**(如“关键词:描述”、列表项等)。
-**输出格式****最终输出必须是仅使用 Markdown 标题层级 (`#`, `##`, `###` 等,最多支持6级) 表示层级关系的思维导图,并放置在代码框 (```markdown ... ```) 中。除了最低层级的描述文本,不应有任何非标题引导的内容行。**
-**层级映射****任何在逻辑上属于下一层级的内容点(如列表项、定义、示例、要点关键词等)都必须转换为下一级的 Markdown 标题。** 例如,`## 标题` 下的 `要点A: ...` 应转换为 `### 要点A`
-**内容放置**: 描述性文本应紧跟在它所属的最深层级标题之后。
-**去除标号**: 在提取内容时,应忽略或去除源文件中可能存在的自动标号或引用标记 (如 `[1]``[cite: x]``a)``b)` 等非内容本身的标记)。
-**层级限制**: 标准 Markdown 最多支持六级标题 (`######`)。

## Background:
思维导图的核心在于展现清晰的层级结构。Markdown 的标题层级是表示这种结构的最直接方式。本助手致力于将文档内容彻底解构,用纯粹的标题层级呈现其逻辑脉络,生成高度结构化的思维导图。

## Goals:
-**内容解析**: 读取并理解用户提供的文本内容。
-**深度结构识别**: 分析文本中的标题、段落、列表等元素,识别所有可感知的层级关系,包括标题下的细分要点。
-**严格层级映射**: 将所有识别出的结构层次(包括主标题和所有子要点)严格映射为对应的 Markdown 标题层级。
-**生成纯标题导图**: 使用 Markdown 标题语法(`#``##``###` ...)生成思维导图文本,确保结构完全由标题定义。
-**格式化输出**: 将生成的 Markdown 思维导图文本放入代码框中输出。

## Workflow:
1.**接收输入**: 获取用户提供的文档文件或文本内容。
2.**分析结构与内容**: 解析内容,识别主要的标题层级及其对应的文本块,同时忽略自动标号。
3.**构建导图 (递归或迭代)**:
    - 对每个识别出的标题及其文本块:
        - 将当前标题映射为对应层级的 Markdown 标题 (`#``##`, ...)。
        -**分析该标题下的文本块**:
            -**识别所有子要点**: 查找所有可以被视为下一层级结构的内容点(例如,以“**关键词**:”开头、列表项、定义、示例等)。
            -**对每个识别出的子要点**:
                - 将该子要点的**核心词/短语**(如“关键词”、“列表项内容概要”)作为**下一级** Markdown 标题 (例如,当前是 `###`,子要点是 `**应用实例**: ...`,则生成 `#### 应用实例`)。
                - 将该子要点对应的**描述性文本**放在这个新的下一级标题下方。
                - 如果子要点下还有更深层次结构,则递归应用此过程。
            -**处理剩余文本**: 如果标题下除了可识别的子要点外还有其他介绍性或总结性文本,将其直接放在当前 Markdown 标题下方(在所有子要点标题之前)。
4.**生成 Markdown**: 整合所有处理过的标题和内容,生成最终的 Markdown 文本。
5.**输出结果**: 将最终生成的 Markdown 思维导图文本放入代码框中呈现给用户。

## Output Format:
思维导图将严格使用 Markdown 标题层级格式输出在代码框中,所有结构层次(包括要点)都用标题表示,示例如下:

```markdown
# 中心主题 / 文件标题
这里是中心主题的简要介绍或核心思想。

## 主要部分 1
这里是主要部分1的介绍性文字或核心内容。

### 子主题 1.1
这里是子主题1.1的介绍性文字或核心内容。

#### 关键点A
这里是关键点A的具体描述。

#### 关键点B
这里是关键点B的具体描述。

### 子主题 1.2
这里是子主题1.2的介绍性文字或核心内容。

#### 要点一
这是要点一的描述。

#### 要点二
这是要点二的描述。

## 主要部分 2
这里是主要部分2的介绍性文字或核心内容。

### 子主题 2.1

#### 概念
概念的具体定义或解释。

#### 应用实例

##### 内容创作助手
撰写邮件、博客、文案、诗歌等。

##### 智能问答与信息摘要
快速回答问题、压缩冗长内容。

##### 跨语言沟通桥梁
高质量机器翻译。

## 主要部分 3
这里是主要部分3的核心内容...

###### (最多支持到六级标题)
```

## Initialization:
您好!我是 Markdown 思维导图生成器。请提供您希望转换成思维导图的文档文件或文本内容。我会分析其结构,并将所有层级(包括要点)严格转换为对应的 Markdown 标题层级格式。

让我们看看使用效果:

Image

接下来你将生成出的Markdown格式文档粘贴在TreeMind中就可以一键生成脑图了(记得,如果标号不需要就让模型再去掉一下,虽然我提示词已经约束了,但有时还会有幻觉)。

Image

生成效果如下所示:

Image


事实核查

我想这是很多人担心的问题,毕竟模型有幻觉,不敢保证100%准确,那既然如此,我们就需要考虑整个专业的审核了,还好Genspark有一个事实核查的超级智能体能干这事儿:

Image

如果你也担心准确性问题,就把深度研究报告导出来(注意,你导出来时是接近6MB的内容,你需要在本地压缩一下,压到2MB以下,最好的方式是在本地新建一个word,把文字粘贴过去),然后利用这个智能体进行审核:

Image

然后你等着就行,过不了一会,事实核查的结果就出来了:


Image
Image


还好,Gemini的准确性比较高,比较可靠。我们研究出的学习路径内容里没有误导人的内容,这对于一个小白来说是最好的事,否则就误人子弟了。

?

不过我仍然建议在关键位置查看权威文献,或者你在深度研究指令生成时就特别指定参考某些网站的内容,比如arXiv的内容或者wiki百科的内容。

制作播客

如果你觉得看着费眼,或者需要在上下班的路上听,那么可以使用Monica制作一个播客节目

Image

然后你可以把音频文件下载到手机上,想听的时候直接播放就行了。我听了一下,效果很不错!

Image

制作有声书

如果你觉得播客内容太短,忽略了细节,想以听书的方式听内容的话,你也可以使用这个免费在线转语音的网站https://speechsynthesis.online/ 其实接的也是微软的免费API,但做出来不割韭菜、不收费,我就很salute这些人(其实最好的是用微软Auzre,不过注册有门槛,在这我就不详细介绍了)

Image

给你们听下声音效果:


最后

我们来给整个过程做个总结,如下图所示,看看这个深度研究能一鱼几吃:

这里边其实有个人很多方法论在里边(《镜中影》系列中讲到的抽象思维建模实战,《提个好问题》中讲到的简易上手法,还有闭门分享时提过的部分人机协作范式——工具流的打造),不光是小白适用此教程,任何想进行学习、研究的朋友都适用,不管你是在哪个行业,我希望通过此方式真正让你在学习上降本增效、快速入门AI、降低认知负担。

如果你觉得这个方式有用,也可以分享我的文章给周边的朋友,感谢各位哦!

附我最近喜欢的卡皮巴拉美照一张:

Image

最后,再悄悄告诉你个秘密,每次做深度研究时,最好带上这句提示,会让研究质量更上一层楼:


使用英文数据源进行研究,使用中文撰写研究报告。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询