我要投稿

大模型支持的教师循证实践：行动框架与案例应用

发布日期：2024-08-25 09:20:22 浏览次数： 2882

作者：开放教育研究

微信搜一搜，关注“开放教育研究”

摘要：教师开展循证实践面临诸多挑战，包括难以获取和利用证据、缺乏有效的反馈和评价机制，以及实践过程中指导和支持不足，大模型技术的发展为破解这些难题带来了机遇。本研究构建了大模型驱动的循证实践行动框架，涵盖循证实践的五个关键阶段：提出问题、检索证据、评价证据、应用证据和后效评估，并针对不同阶段的特点设计了相应的大模型支持策略；开发了 GPT4EBP 平台，为教师提供基于自然语言交互的个性化指导、反馈和评估，还针对师范生开展了为期六周的循证实践。问卷调查结果表明，借助 GPT4EBP 平台，师范生能更高效、高质量地完成循证实践任务，其循证实践能力和集体效能感均得到显著提升；访谈数据揭示了平台在简化流程、提供及时反馈等方面的价值。本研究揭示了大模型技术在优化循证实践流程、赋能教师专业决策等方面的独特价值，丰富和发展了循证实践的理论体系，相应的行动框架和 GPT4EBP 平台可为教师循证实践提供个性化支持，使其能便捷获取证据、系统分析证据并将证据转化为可落地的教学行动，提升循证实践的针对性和有效性。

关键词：教师专业发展；循证实践；大模型；行动框架；GPT4EBP

一、引言

循证实践（Evidence-based Practice，EBP）兴起于 20 世纪 70 年代的医学领域，强调医疗工作者在决策时需应用经过系统评价的最佳研究证据（Sackett et al., 1996）。此后，这一理念被管理学、社会工作、心理学等领域广泛采纳。20 世纪 90 年代，哈格罗夫斯（Hargreaves, 1997）提出教师教学应更多依据证据而非仅仅依赖经验或直觉，并将循证实践引入教育领域，为政策制定、课程设计、教学方法选择等提供新的实践模式。在我国，循证实践也被视为提升教育教学质量和推动教师专业发展的重要途径（朱旭东，2014；赵萍等，2022）。

然而，国内外教育领域的循证实践面临诸多现实困境，其中之一是教师难以有效获取和利用教育研究证据。大量研究成果分散在各类文献中，对于一线教师而言，检索和获取文献费时费力（Zimmermann et al., 2022）；许多证据的呈现形式过于学术化，教师难以理解其含义，更难以将其应用于教学实践中（Renkl, 2022）。此外，一线教学环境难以为循证实践提供充分支持。循证实践涉及证据检索、评价与应用等环节，很多学校尚未建立评估与支持机制，难以为教师提供循证效果的阶段性反馈。在这种情况下，教师很难获得将研究发现转化为可行教学方案的系统指导（Dekker & Meeter, 2022）。久而久之，教师难以在循证实践中获得成就感，逐渐丧失了动力和意愿（Voss, 2022）。

为应对上述挑战，促进循证实践的有效落地，越来越多的研究者开始改进其方法和策略。有研究者将循证实践与教研活动相结合，提供面向不同场景的实践方案，如循证听评课（廖伟等，2023）、课例研究（张春莉等，2023）等；还有研究者提出教师循证实践课程，旨在从循证实践理念、方法或所需技能（吴雨宸等，2023；裴淼等，2020）等角度提供相应的培训与指导；也有研究者致力于优化循证实践的支持环境，提出建立面向教育的专用证据库、证据管理方法等（戴伟芬等，2023），为教师快速、精准地获取和运用证据提供支持。大部分研究者意识到，面对循证实践的诸多挑战，无论是实践方案的创新、教师培训的优化或支持环境的完善，都需要技术的辅助。为此，越来越多的研究从技术视角探寻解决方案，如通过大数据的知识发现方法追踪循证研究过程，优化循证过程和教师的知识建构（陈鹏等，2023）；探讨人工智能支持循证教育的技术架构（吴南中等，2023），利用智能技术优化证据管理等。近期，以 GPT-4、Claude3、文心一言等为代表的大语言模型（Large Language Model，LLM）凭借强大的泛化能力和高效的文本信息处理能力，在知识理解、逻辑推理等方面展现出卓越的能力（OpenAI, 2023），有望成为应对循证实践关键挑战的重要工具，为摆脱实践困境提供新的切入点。

基于上述认识，本研究将大模型与循证实践的行动阶段整合，提出大模型驱动的行动框架；以自主开发的“GPT4EBP”平台为例，解释如何在实践案例中应用该行动框架。通过展示大模型对循证实践的综合影响，本研究可为教师开展循证实践提供支持工具和示范案例。

二、文献综述

（一）开展循证实践的现实困境

随着有关人类发展和学习方式的知识的迅速增长，教师需学会有效利用神经科学、心理学、社会学、学习科学等领域的证据，并将其融入教学（Darling-Hammond et al., 2019）。大量研究表明，循证实践有助于促进教师反思，提升其专业素养和教学研究能力（Dekker & Meeter, 2022）。然而，教育情境的特殊性常常导致循证实践面临三种困境，效果不及预期。

1. 证据的可及性与可用性不足

在教育领域，循证实践面临研究证据的可及性和可用性不足等挑战（Dagenais et al., 2012）。研究发现，虽然教育研究数量近年持续增长，但有价值的研究成果仍隐藏在付费的学术数据库和期刊中，多数教师难以便捷地获得这些资源（Goldacre, 2023），信息获取的困难增加了教师循证实践的难度。此外，即便教师能够获得文献资源，教育领域证据的多样性和特殊性也使得教师难以筛选出对自己教学实践真正有帮助的证据。这需要教师具有必要的研究知识和技能，还需要投入相当多的时间和精力（Forman et al., 2009）。布朗等（Brown & Greany, 2017）发现，教师和学校领导并不总是有足够的时间参与循证实践、学习研究内容或将研究成果应用于新的实践改进项目。

在可用性方面，研究者普遍认为，尽管教育研究数量众多，但真正能为教育实践提供指导、目标明确的证据不多，教育实践与研究之间的鸿沟仍然存在。凯恩等（Cain et al., 2019）指出，教育工作者常因学术研究使用的深奥语言而难以参与其中。同时，教育研究质量也受到批评，一些研究虽然方法严谨，但对教师来说可能缺乏实用、具体的教学建议（Biesta, 2010）。此外，学术研究的独立性或针对的特定背景使教育工作者难以确定如何将研究结果应用于教学环境（Gough, 2021）。因此，教师需要更多针对性和本地化的定制资源。

2. 实践场域中反馈和评价机制的不足

教学实践场域中反馈和评价机制的不足是阻碍教师有效开展循证实践的又一重要因素。这一挑战突出表现在两个层面：

一是教育环境和文化的多样性对循证实践限制。受不同社会经济、文化和制度因素的影响，在特定环境中有效的教学方法可能在其他环境中效果不佳（Forman et al., 2009）。为此，有研究者指出需要对证据中提倡的做法进行本土化评估，以确保其在实践中适用（Abramczyk & Jurkowski, 2020）。然而，研究发现，许多学校和区域的教育文化倾向于尊重传统和惯例，导致在缺乏对循证实践的共识和支持的情况下，教师倾向于沿用传统教学方法（Huczynski & Buchanan, 2010）。例如，明特罗普等（Mintrop & Zumpe, 2019）在英格兰的学校发现以行动为导向的文化特征，阻碍了包括循证实践在内的中长期教学改进。

二是教学策略改进的持续性使得循证实践更加复杂。阿布拉姆齐克等（Abramczyk & Jurkowski, 2020）指出，教学策略的实施受学生需求、政策指导和资源环境的影响。随着时间的推移，原本有效的教学策略可能需要调整以适应实践情境的变化。这就要求教师不断评估和更新教学方法。然而，由于缺乏系统的反馈机制，教师往往难以获取多方利益相关者的反馈，难以根据不同主体的实际需求和反应调整教学（Gray & Campbell-Evans, 2002）。

3. 缺乏循证实践的指导和支持

研究者发现，教师开展循证实践缺乏相关培训和指导。培训不足导致教师在实施循证实践时普遍缺乏所需的知识、技能和态度，特别是在理解和应用研究方法方面（Surma et al., 2022）。许多教师未受过充分的培训，解读学术文献会遇到困难，甚至会误解研究结论（Ferguson & Bråten, 2022）。指导与支持不足带来三方面问题：

一是对研究方法理解不透。教师需要深入理解研究方法，才能识别和理解高质量研究的意义和局限。然而，许多教师决策时很少使用科学证据，却使用轶事性证据。这不仅妨碍他们准确解读教育文献，也限制他们从研究中获取有用信息的能力（Dixon et al., 2014）。此外，有研究发现教师对学术研究存在误解或持怀疑态度，认为研究过于理论化、与实际教学脱节（Willingham, 2012）。

二是批判性思维能力不足。批判性思维是循证实践的核心，要求教师全面评估各种证据，而不是盲目接受或拒绝某种教学方法。戴维斯（Davies, 1999）指出，许多教师未能充分认识到研究的局限性，或难以区分经验性证据和科学研究间的差异。例如，有些教师可能过于依赖某些特定来源（如学校的传统做法），忽视了广泛探索、对比和评估多种证据来源的重要性（Jacobs et al., 2015）。

三是心理障碍在很大程度上影响教师开展循证实践的意愿和能力。巴斯金等（Basckin et al., 2021）强调，效能感的不足可能使教师无法自信地尝试新的教学方法或策略，担心失败或受到批评。特别是在缺乏同侪、组织或包容性环境的支持下，教师可能会感到与新方法格格不入，甚至抵制改变（Spillane, 2017）。

综上，教师循证实践遭遇许多障碍，制约着教师专业发展。这些困境既与研究证据的可及性和可用性有关，又与复杂多变的教学环境以及教师自身缺乏循证实践知识和技能短缺有关。

（二）大模型的应用

随着大模型在教育中应用的不断深入，学界开始关注大模型在教师专业发展领域的应用潜力（Kim et al., 2022; Xu & Ouyang, 2022）。有研究认为，随着大模型技术的发展，教师将承担更关键和专业的角色，以最利于学生的方式整合技术，并与大模型形成互补关系（Jeon & Lee, 2023）。

1. 推进教师专业实践

首先，大模型可以帮助教师优化教学设计。研究表明，使用 ChatGPT 等工具的物理教师能够开发高质量的教学任务，其任务适切性和正确性表现更佳（Su & Yang, 2023）。还有研究者针对数学教学设计了专用提示框架，教师可以使用特定的提示和问题排序，创建与教学内容和学情相关的数学教学计划（Moore, 2023）。也有研究者认为，与传统的谷歌搜索结果相比，ChatGPT 等能够模拟对话，生成更具针对性的内容，可以作为教师专业咨询的虚拟伙伴（Kasneci et al., 2023）。例如，新手教师学习学科教学知识相关材料时，可通过提问，要求 ChatGPT 澄清课程材料，以不同方式给出解释或提供新的解释（Kohnke et al., 2023）。

其次，教师可以利用大模型生成多元化的教学资源。例如，研究人员使用大模型生成交互式教育材料，如测验和问答卡片。这些材料被证明可用于改善学生的学习和参与度（Moore et al., 2022）。在编程教学领域，有研究者利用大模型创建更适切的编程练习（Prather et al., 2023）。萨尔萨等（Sarsa et al., 2022）发现，CodeX 模型能够基于单一的启蒙例子生成高质量的学习资源，包括解释编程错误信息和形成初始代码块。数学学科的研究者利用大模型制作系统的学程包，协助教师将先进的教学理念转化为教学实践（Knorr, 2019）。

最后，大模型能提供具体且细化的教学评价，为教师提供针对性反馈。研究显示，基于大模型的自适应反馈能够帮助教师及时评估作业质量，从而有效改进教学方法（van den Berg & du Plessis, 2023）。此外，大模型在情感识别文本方面的优势也被用于分析在线课程的学生评教信息，自动生成课程改进建议（Sailer et al., 2023）。

2. 拓展教师专业发展途径

传统的教师专业发展往往依赖培训、研讨会和经验共享等方式提升教师的教学技巧和理论知识（Avalos et al., 2011）。然而，这些传统方式往往受时间、地点和资源可用性的限制，难以为教师提供个性化和持续的学习机会（Postholm et al., 2012）。大模型促进教师专业发展主要体现在辅助教师改进教学和持续学习两方面：

一方面，大模型可以辅助教师有效利用学科教学知识。传统的理论、案例研究等难以应对多样化的教学挑战，适应多元的学习需求（Van et al., 2023）。大模型有助于教师深入理解和应用各种教学理论。例如，ChatGPT 等工具不仅可以生成对特定教学理论的详细解释，还可以结合本地教学材料生成相应的教学活动设计示例。

另一方面，大模型支持教师个性化学习的潜力不容忽视。目前的研究聚焦如何利用 GPT-4 等大模型促进教师理解和应用教育理念（陈向东，2023），如帮助教师流利和准确地解读相关领域的国际研究成果，设计面向大模型的提示集，以辅助教师有效利用教育教学理论改进实践等。

3. 重塑教师专业发展场景

近期的研究还强调大模型不断扩展的应用潜力以及利用大模型创新的机会。现有的大模型技术展示了其在感知、行动或与环境交互方面的自主和智能化能力，可用于更复杂的教育应用开发。例如，检索增强生成（retrieval argument generation）作为构建新型大模型应用的重要概念之一，强调通过外部知识源为大模型提供附加信息，从而生成更准确和符合上下文的答案，减少“模型幻觉”的发生（Lewis et al., 2019）。这些应用结合专有数据与大模型内部知识表征，生成特定的行动序列，一步步辅助教师专业发展活动，拓展教师与大模型协同工作的可能性（Kasneci et al., 2023）。

首先，大模型通过整合高级记忆模块和自动化技术，可追踪分析物理或网络环境的不同数据源，为教师提供定制化的决策支持。例如，在医学领域，基于大模型代理的专业问答系统（医学 QA）能有效提取医学教科书中的知识，提高回答的专业性，支持医护人员作出基于证据的决策（Sun et al., 2023）。

其次，将大模型嵌入教师专业发展的不同场景，可拓展人机交互的可能性。例如，麻省理工学院的人工智能助手（Copilot for Real-world Experimental Scientist，CRESt），利用大模型串联起科学实验的工作流。CRESt 的特点是能够调用真实世界的机械臂自动做生化实验，自主查找专业材料数据库，并基于实验结果和证据检索结果提出优化材料配方的建议（Ren et al., 2023）。这表明大模型能以人机协同的方式参与教师专业发展，包括提供专业问答、调取资源，甚至执行物理动作等；大模型自然语言理解的优势可以提高教师对这些活动的适应性。

大模型在教师专业发展场景中展现出的应用优势，有望成为突破循证实践发展瓶颈的重要技术手段。教师可以利用大模型深入理解和应用各种证据，获得基于证据的教学理论解释、资源示例等，提升循证所需证据的可用性。同时，大模型能针对核心环节给予精准支持，甚至可以融入循证实践全过程。例如，CRESt 等能够参与问题分析、方案设计、规划任务、调取资源等流程；医学 QA 系统可提取领域知识以支持循证决策，这为教师高效利用证据资源库提供了启示。大模型还可通过问答、指导等方式为教师循证实践提供个性化指导。例如，教师可利用大模型获得循证操作的解释示例，降低实施门槛。

综上所述，前期实践探索了大模型对循证实践不同行动场景的支持。然而，少有研究关注如何在循证实践整个行动过程中合理有效地应用大模型。因此，如何结合大模型应用案例梳理其适用性，构建适切的行动框架，为教师突破循证实践困境提供实施路径，成为亟需解决的问题。

三、行动框架

（一）大模型的适用性

首先，大模型可以用于专业问答，有效缓解指导不足、证据可及性和可用性不高等问题。多项基准测试显示，大模型在多个学科领域已达到人类专家水平（OpenAI, 2023）。借助 ChatGPT 等大模型应用，教师能够获得学科教学的理论知识，如教学策略、学习理论、课程设计原则等，还可以上传本地教学资料，获得更具针对性的建议。需说明的是，尽管这类应用还不能直接生成或推荐真实的研究证据，但其作为辅助检索工具已显示出较好的适用性。例如，基于大模型生成证据检索的布尔查询，可以间接辅助教师在专业数据库中查询相关证据（Wang et al., 2023）。

值得注意的是，一些文献数据库已开始整合大模型以支持自然语言的检索，如 Elicit.ai、typeset.io、consensus 等。Elicit.ai 平台使用 GPT-3.5 等大模型自动检索文献，并依据用户需求提供关键信息提取、文献综述和内容导出等功能（Whitfield & Hofmann, 2023）。集成 GPT-4 模型的 Bing 搜索引擎和 Perplexity 人工智能在线助手等工具能根据提示信息和信息源（如文献数据库、知识社区等）生成个性化内容（Gravina et al., 2024）。相较于生成检索式，该应用改变了证据获取的方式。例如，教师可通过自然语言描述文献主题，Perplexity 利用大模型分析教师需求，调用 Semantic Scholar 等文献数据库的 API，结合获取的信息及模型的知识库生成回答。这种交互式检索方法使教师能高效筛选与教学实践紧密相关的证据。

其次，教师可利用大模型快速分析教学实践数据和研究证据，缓解教学实践场域反馈和评价机制不足问题。例如，GPT-4 的代码解释器（Code Interpreter）组件，可以直接处理数据资料，结合用户的提示从特定角度提取关键信息，辅助教师深入理解证据内容（如量化证据的结果解释）。此外，大模型在质性数据分析方面也有突出潜力。例如，有研究将大模型应用于质性文本的编码，开发了人机协同编码的过程框架和支持平台“CollabCoder”，发现大模型能有效提升文本编码的效率与准确度（Gao et al., 2023）。InsightPilot、ChatGPT-4 等工具展示了大模型如何通过自然语言解析和数据可视化简化数据分析过程，提升数据驱动决策的质量和效率（Ma et al., 2023）。这些应用使教师能便捷地挖掘不同来源数据的关键信息，及时获得个性化反馈，持续优化实践改进方案。

最后，大模型可以深度参与循证实践的全流程，在计划制定、过程监控、效果评估等方面为教师提供及时反馈和行动建议，有效缓解循证实践指导和支持不足问题。例如，AutoGPT 的长期和短期记忆管理功能能够积累和利用对话过程中的关键信息，分析教师互动和行动偏好，追踪任务进展，有针对性地调整实践方向（Suri et al., 2023）；JARVIS 系统通过 ChatGPT 调用多个专家模型，将复杂的用户请求分解为多个可执行的子任务（Wang et al., 2024）。这些应用支持教师通过与大模型的互动对话完成大部分循证实践任务，甚至可以直接解决典型的循证实践问题。

为提升大模型的适用范围，本研究依据循证实践的特点构建了大模型驱动的行动框架。该框架规范了循证实践的各个阶段，明确每个阶段输入输出的要求和任务标准，指导教师有序完成各项活动。这一框架有助于整合多源数据流，优化证据资源的调取和利用，增强大模型协同的精准度和连贯性。因此，它能为教师开展循证实践提供更加规范、高效、智能的大模型支持，最大限度地发挥大模型的应用优势。

（二）行动框架

正如上文所述，一些研究者已经尝试将大模型应用于循证实践的相关环节（如文献检索），或在类似场景中探索其积极作用。然而，这些尝试往往聚焦于循证实践的单一任务或环节，难以适配整个实践流程。这就需要结合循证实践的行动流程、阶段特点，改进大模型的应用方式。目前，学界普遍参考循证医学的“5A”实践框架，将其分为五个行动阶段：提出问题、检索证据、评价证据、应用证据和后效评估（童文昭等，2024；吴南中等，2023）。这种分段有助于明确循证实践的关键步骤，增强流程的规范性和透明度。同时，阶段划分也为大模型的整合提供了明确指导，确保大模型能针对性地解决循证实践中的具体问题。

基于此，本研究设计了大模型驱动的循证实践行动框架（见图 1），展示大模型如何通过与教师协同交互，帮助教师解决循证实践的常见难题。

阶段一：提出问题。提出问题是循证实践的起点，教师需要准确识别、阐明和聚焦可改进的实践问题，为后续证据检索奠定基础。大模型在这一阶段可以提供有力支持：分析各类教学数据，识别潜在问题的微弱信号，帮助教师发现可能被忽视的问题盲点；利用其庞大的知识库，为问题的成因和实际影响提供多角度的理论解释，深化实践和理论之间的联系；引导教师深入思考和概括问题，确保问题的可行性和实践的有效性。

阶段二：检索证据。教师需要寻找与实践需求高度相关的研究证据。这要求教师能够有效访问和筛选教育资源。大模型的应用可以优化检索流程：支持以自然语言对话形式检索证据，允许教师以日常语言描述查询需求，降低传统检索的技术门槛；对选定文献进行内容加工，如自动生成内容摘要等，帮助教师快速理解和筛选证据；根据对话的上下文动态调整证据检索结果，使教师能够在较短时间内获得精准和高质量的证据。

阶段三：评价证据。深入分析和评估检索到的证据是循证实践的关键，目的是从中提取对教学改进有指导价值的信息。元分析（meta-analysis）和元综合（meta-synthesis）是两种常用的证据评价方法，但这些方法对许多教师而言较为陌生，且难以操作（曾昭炳等，2020；仇星月等，2022）。大模型可依据教师需求识别单篇文献的质量和相关性，减轻教师重复处理的负担；根据编码结果，向教师推荐适当的评价方法与策略。对于元分析，大模型可以自动运行统计分析代码，计算效应量，并基于分析结果向教师提供具体教学情境的解释，帮助教师理解统计结果的教学意义；对于元综合，大模型可以发挥文本理解的优势，综合不同研究的启示。

阶段四：应用证据。应用证据指将经过评价的证据应用于教学改进的实践环节，关键在于如何将证据评价结果转化为可行的教学策略、活动或资源等。大模型在此环节的作用尤为关键。它可以通过以下方式协助教师解决难题：引导教师深入解读证据评价结果，利用与教学实践密切相关的场景和材料，帮助教师识别和理解证据与实际教学环境之间的关联及差异；支持教师根据评价结果构建实用的教学资源框架，提供基于证据的教学设计和活动案例，简化从理论到实践的转化过程；协助评估改进方案，即通过模拟与不同角色（如学科教学专家）的互动，使教师能够在虚拟环境中预演和改进教学方案，增强方案的实用性和适应性，预见方案在真实教学场景的应用效果。

阶段五：后效评估。后效评估旨在评价应用证据后的实际教学效果与预期目标之间的契合度。教师需要将分析结果与实际教学紧密结合，识别教学改进的成效及不足。大模型在这一阶段能够基于教师需求，设计和推荐适当的评估工具，全面捕捉方案的实施效果。例如，大模型辅助的课堂观察可以帮助教师系统记录和分析课堂互动的变化；自动分析学生作业和测试成绩，形成基于多维数据分析的综合评估结果，全面反映教学改进成效。

大模型可以理解教师的任务指示，根据实践情境感知调用必要的外部资源和工具，协助完成各个阶段的行动目标。这种人机协同的互动模式也变革了传统的循证实践流程：教师可以通过与大模型的自然语言对话，随时提出问题和疑惑，以获得即时的反馈和建议；大模型能理解教师的任务指示，也能根据实践情境的感知（对上下文的理解）调用必要的外部资源和工具，协助完成各个阶段的行动目标；在与大模型的持续对话中，教师在每个阶段的输出（包括互动历史数据）可以作为与大模型协同的背景信息，从而形成连续的任务流；通过持续监测循证实践流程，大模型能够提供针对性建议，指导教师不断优化实践策略。

然而，仅依赖现有的大模型应用可能还不足以有效实施行动框架。这些应用相对独立，缺乏统一的过程管理和数据汇聚框架。教师需要在不同应用之间频繁切换，手动传递数据。这会影响实践的连贯性和效率，也会加大过程追踪的难度。尤其是对经验不足的教师，他们可能难以利用分散的应用有序开展实践。基于此，本研究设计了循证实践支持平台 GPT4EBP，为行动框架提供落地支撑。

GPT4EBP 平台采用大模型代理的技术框架，通过拓展和增强原生大模型的能力，为教师循证实践提供全流程、多维度的智能支持。平台针对循证实践的关键阶段设计了独立的对话空间和内嵌的情境化提示模板，引导教师有序、准确地完成开展任务。此外，平台还采用问答支架、自适应提示推荐和资源分析等，提升教师在问题分析、证据探索和教学设计等方面的效率和专业性，推进教师与大模型在循证实践中的高效协同。

四、应用案例

本研究邀请 H 大学教育技术学专业师范生参与循证实践，探索如何利用 GPT4EBP 平台改善师范生的循证实践质量。

（一）案例简介

传统的循证实践教学主要关注行动框架的前四个阶段，采取专题讲解和小组实践相结合的方式，由任课教师介绍循证实践的基本概念、行动流程和操作方法。具体安排如下：第 1 周教师介绍循证实践的定义、意义和典型案例等；第 2 周引入小组实践，教师引导师范生基于教学反思提出可供检索的教学改进问题（提出问题）；第 3 周教师指导师范生形成系统的检索词，并查询相关教育研究证据（检索证据）；第 4 周教师讲解分析证据材料的元分析方法，提供操作指南和案例演示（评价证据）；第 5 周教师协助师范生依据评价结果制定教案的优化方案（应用证据）。师范生在此面临的共性困难有：

1）获取和评价高质量证据的能力有限。师范生往往难以有效检索和筛选与教学问题相关的文献，对证据的质量和适用性缺乏全面的判断，应用证据指导教学实践的经验不足。他们可以通过文献综述等总结证据，但如何将证据转化为教学策略和行动难以提出针对性的行动方案。2）难以在短时间内掌握和应用循证实践的方法和技能。受限于课程安排，传统教学较难为师范生提供充分的指导，这会影响他们开展循证实践的信心。

为了满足案例的实际需求，研究团队开发了 GPT4EBP 平台，通过调用 GPT-4 模型的 API 实现部分基础性功能。GPT4EBP 平台主要承担行动步骤引导、证据文本分析与自由对话三大功能，与案例中涉及的四个阶段紧密相连（见图 2）。

其中，行动步骤引导为师范生提供明确的任务指导和流程支持；证据文本分析允许师范生在评价证据阶段上传文献证据等材料，并利用平台的自然语言处理能力对证据开展自动化质量分析和关键信息提取；自由对话为师范生提供开放、灵活的交互渠道，师范生可以随时通过与平台对话获得个性化的指导和反馈。

（二）案例设计

本案例的参与者为 30 名教育技术学专业的硕士研究生。他们被随机分配到四个小组，每组 6至 8 人。案例实践从 2023 年 5 月 8 日开始，为期 6 周，分三个阶段：准备、实践和展示（见图 3）。

准备阶段（第 1 周）：教师课堂讲授介绍循证实践的基本概念、流程和方法，引导师范生熟悉 GPT4EBP 平台的功能和使用方法。

实践阶段（第 2—5 周）：师范生以小组为单位，在 GPT4EBP 平台的支持下开展循证实践。各小组基于教学经验和兴趣分析现有教案的不足，提出拟解决的教学改进问题（第 2 周），并在平台引导下开展证据检索（第 3 周）、证据评价（第 4 周）和教学方案设计（第 5 周）。在提出问题阶段，GPT4EBP 平台引导师范生分析教案、推荐改进策略，帮助他们梳理和识别教案中存在的问题；在证据检索阶段，平台通过对话引导师范生选择关键词、数据库，构建检索策略；在证据评价阶段，平台助力师范生理解不同研究设计的特点、证据的质量和适用性；在教学方案设计阶段，平台通过案例推荐、方案优化等，支持师范生将证据转化为教学改进策略。

展示阶段（第 6 周）：各小组基于前期的循证实践，改进教学设计方案，并通过演示汇报呈现实践过程和成果。

为评估 GPT4EBP 平台对师范生循证实践的多维影响，案例的评价设计采用混合研究方法。其中，定量评价维度包括：

1）循证实践能力：本研究采用循证实践能力评估量表（李敏，2017），评估师范生的循证实践态度（12 项，Cronbach α=0.79）、技能（5 项，α=0.89）和知识（9 项，α=0.87）。

2）集体效能感：本研究采用改编自周春红等的集体效能感问卷，评估教师协作情境下的效能感（周春红等， 2021）。该问卷包括内部联合信念（7 项，α=0.89）、领导力信念（6 项，α=0.95）和外部资源信念（3 项，α=0.84）。

3）技术接受度：主要调查平台的可用性、易用性以及未来的使用意愿。

此外，为了理解 GPT4EBP 平台的应用效果，本研究采用半结构访谈收集教师的反馈和体验，包括平台使用体验、循证实践遇到的挑战和平台如何帮助其克服挑战等。前后测安排在第 1 周和第 6 周，访谈和技术接受度测量安排在第 6 周。

（三）案例评价

总体而言，借助平台的支持，各小组均顺利完成了循证实践，并将多种新的教学策略有效融入教学设计。评价结果（见表 1 和表 2）显示：

首先，平台应用提升了师范生的循证实践水平（t = 4.04，p < 0.05），有小到中等促进作用（d总体 = 0.38）。其中，师范生循证实践技能和知识显著提升（t技能 = 5.13，p < 0.05；t知识 = 4.74，p < 0.05），提升知识与技能的促进作用较大（d知识 = 0.70， d技能 = 0.76），但循证实践态度变化并不显著（t = 0.21，p > 0.05）。这一结果突显了平台在技能和知识传递上的有效性，同时表明需关注如何提升教师对循证实践价值的认识。

结合分析访谈可以发现，GPT4EBP 平台通过辅助与引导提升了师范生的循证实践知识与技能，使得原本复杂的循证步骤变得高效可控。访谈结果显示，平台简化了循证实践的流程，让师范生能够专注于学习和掌握新知识。如学生反映“使用平台后，工作变得简单了，我们能投入更多时间学习。”同时，平台的反馈机制帮助师范生有效整合过程信息，如学生反映“平台的连续提问帮助我们认识到教改问题的多个方面，我们可以查看聊天记录回顾学习过程。”此外，应用证据阶段的交互体现了师范生有效利用证据改进教案的能力。“我们需要多聊几次，让大模型理解我们的意图，它生成的资源和建议质量还是很高的。”

关于平台未能显著改变师范生对循证实践的态度，部分学生反映：“平台确实使循证项目的开展更加便捷，但若不进行循证，利用大模型开展教学设计也同样可行。”这反映出一个关键问题，即平台虽然提高了操作效率，但未能深化师范生对循证实践价值的理解和认同。

其次，平台应用显著提升了师范生整体的集体效能感（t = 8.05，p < 0.05），影响效果小到中等（d总体 = 0.37）。这表明通过使用平台，师范生在团队内部协作和外部资源利用方面感受到了更强的支持和自信，尤其外部资源利用的提升最显著（t = 4.60，p < 0.05），接近中等水平（d外部资源 = 0.49）。

访谈文本还显示，平台的介入使得循证实践小组加深了成员协作的联系，提高了他们共同完成循证任务的信心。师范生把平台视作“永远不会拒绝问题的伙伴”。特别是在生成资源和提供创新解决策略方面，平台显示出独特价值。学生反映，“平台提出的许多观点是我们之前未曾考虑的……任何人都可以与它对话，这让我们的讨论更加有参与感”“它迅速帮助我们构思出教学活动”。这些反馈表明，GPT4EBP 已经成为增强教师信心的“智慧学伴”。

此外，师范生普遍对平台的直观和明确的自然语言交互方式给予高度评价。例如，一位师范生指出：“我只需上传文献，平台便能根据我的指令提取相关内容，方便批量处理文献。”在实用性方面，绝大多数师范生赞赏平台在任务规划、检索和评价证据阶段的便利性，特别是它的快速筛选和解析文献资源的能力。这表明平台能有效协助教师管理和应用证据资源。

再次，技术接受度调查结果显示，师范生对平台的可用性和易用性持积极态度（见表 2）。半数师范生对平台的实用性给出高分评价，但长期使用意愿的评价得分较低。这表明需要考虑如何维系教师的长期兴趣和参与。

访谈结果显示，长期使用意愿的不足主要在于平台处理复杂问题时的回应过于“模板化”。这表明，平台在简化实践流程方面表现出色，但提供个性化解决方案方面还有待提升。

作为大模型技术在教师专业发展领域应用的初步尝试，GPT4EBP 平台的应用实践初步验证了本研究提出的行动框架的有效性。一方面，GPT4EBP 平台简化了循证实践流程，师范生在不同环节能得到智能化的引导与支持，循证知识和技能得到显著提升；另一方面，平台在增强师范生团队完成循证实践的信心方面发挥了重要作用，团队协作和资源利用的信心有了明显提高。这对于培育教师循证实践能力具有深远影响。

这一案例的实施不仅为大模型促进循证实践提供了应用示范，也指出了未来研究方向，如提升教师对循证实践的认识，提升平台响应的个性化和针对性水平等。随着平台功能的优化，GPT4EBP 有望成为教师循证实践的重要辅助工具，循证实践也有望成为大模型驱动的重要教育教学场景。

五、结语

循证实践作为连接教育研究与教学实践的桥梁，对于推动教育领域知行合一具有重要价值。然而，教育研究证据的碎片化和非结构化特点，以及教师自身循证意识的匮乏，循证实践在教育一线的推广和落地面临诸多困境（Thomm et al., 2021; Brown & Zhang, 2016）。大模型具有的自然语言处理、知识表征、逻辑推理等技术特性为破解上述难题提供了新的路径。大模型可以辅助教师理解教学情境、挖掘领域知识、筛选与推荐证据，并为循证决策提供反馈与建议，从而有效弥合教育研究与实践的鸿沟，实现研究证据向教学实践的转化与落地。本研究提出的基于大模型的循证实践行动框架，为教师循证实践提供了智能化解决方案。从理论层面看，该框架以突破循证实践落地的困境为突破口，揭示了大模型技术在优化循证实践流程、赋能教师专业决策等方面的独特价值，不仅丰富和发展了循证教学的理论体系，也为构建智能时代人机协同的教师专业发展模式提供了新的路径。从实践角度看， GPT4EBP 平台为教师循证实践提供了个性化支持，使其能便捷获取证据、系统分析证据，并将证据转化为可落地的教学行动，提升了循证实践的针对性和有效性。本研究的不足在于：

首先，正如赫奇斯（Hedges, 2012）强调的，循证实践需要建立在扎实的学科教学知识（pedagogical content knowledge， PCK）基础上。当前大模型在 PCK 表征和应用方面虽然具有理论潜力（林梓柔等，2023），但缺少实证研究基础，后续研究可探索利用教育领域的专家知识对大模型进行微调，提升其对学科教学的理解和推理能力，为教师提供更加精准、针对性的循证支持。其次，证据的应用需考虑特定情境的复杂性和动态性（Biesta, 2010）。在目前的案例中，GPT4EBP 给出的证据应用建议可能难以充分契合教学实践的具体语境，后续研究需考虑教学情境的差异性，鼓励教师结合经验与语境调整证据应用，提升循证决策的生态效度。此外，循证只是教学决策的参考依据，教师的专业判断和自主性同样不可或缺（Hargreaves, 1997）。后续研究可探讨如何处理好技术赋能与教师能动性的关系，在发挥大模型优势的同时，保障教师的主体地位，促使二者形成合力。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业