我要投稿

刘明等 | 教育大模型智能体的开发、应用现状与未来展望

发布日期：2024-11-28 14:49:08 浏览次数： 3202 作者：现代教育技术杂志社

摘要：教育大模型智能体是新一代生成式人工智能技术，可以利用大语言模型进行任务分解和规划，调用工具和知识库，完成复杂多样的教育任务，但也同时存在对其技术原理和新特征认识不深、应用现状探究不够全面、教育效能不明晰等问题。为此，文章首先从技术角度介绍了教育大模型智能体的开发情况，包括设计教育大模型智能体的技术架构、分析其主流开发框架与平台的优缺点。之后，为呈现教育大模型智能体的应用现状，文章引入国内外20个典型的教育大模型智能体进行比较分析，提炼出教育大模型智能体的新特征，总结了教育大模型智能体在教、学、管、评四大应用场景中发挥的作用，并介绍了不同场景下教育大模型智能体的应用案例。最后，文章结合教育大模型智能体应用面临的机遇与挑战，对其未来前景进行了展望。文章的研究推动了教育大模型智能体的开发与创新应用，有利于促进教育数字化转型和教育高质量发展。

关键词：教育智能体；大模型；教育大模型智能体；生成式人工智能

引言

2024年3月，教育部启动人工智能赋能教育行动，并发布了四项具体行动，将促进新一代人工智能技术与教育教学深度融合，推动教育大模型落地应用，赋能教育高质量发展^[1]。教育智能体是人工智能教育应用领域的重要研究方向，支持个性化学习的发展，但存在对话交互能力不强、开发成本高、知识动态更新难、通用性知识差等问题^[2]，已难以满足高质量教育教学的需要。而大语言模型拥有海量的通用知识，能够流畅地回答用户几乎所有的问题，有助于提升学生在阅读、写作、数学、计算机、语言等方面的知识技能^[3]，但存在可解释性不足、师生过度依赖、偏见和“幻觉”等问题^[4][5]，难以适应复杂、多样的教育任务。在此背景下，基于大语言模型的教育智能体——教育大模型智能体应运而生。

教育大模型智能体是新一代生成式人工智能技术，其充分利用大语言模型在自然语言理解与生成、逻辑推理、多模态感知、通用学科知识和自我学习等方面的强大能力，能够自主规划教育任务、感知多模态教育信息、调用知识库与教育工具、完成复杂多样的教育任务，并为人工智能教育教学的创新应用提供关键技术支撑。但与此同时，教育大模型智能体也还存在对其技术原理和新特征认识不全面、教育应用现状探究不够深入、教育效能不明晰等问题。为此，本研究尝试先从技术角度剖析教育大模型智能体，之后从新特征、应用场景、应用案例三个方面呈现教育大模型智能体的应用现状，最后结合教育大模型智能体应用面临的机遇与挑战对其未来前景进行展望，以期为深度赋能教育教学全过程提供新思路，推动教育高质量发展。

一教育大模型智能体的开发

智能体是指能够感知环境并自主采取行动以实现特定目标的实体^[6]。教育智能体继承了智能体的核心特性，并专门针对教育环境和任务进行设计与优化。在大语言模型出现之前，教育智能体经历了智能导师系统、可视化的虚拟角色、智能会话机器人等外在形态的演变^[7][8]，但其本质仍然是一种教育软件或硬件实体。刘清堂等^[9]将教育智能体定义为由计算机生成、呈现于教学场景中的虚拟形象，其目的是促进学习者的认知学习。从技术演进来看，教育智能体经历了基于逻辑规则、符号表示、自然语言处理、计算机视觉、大数据、深度学习、情感计算和人形机器人等技术阶段^[10][11]。当前，大语言模型的出现推动教育智能体进入自主智能和群体智能阶段，教育大模型智能体以通用或教育大语言模型作为逻辑推理的核心“大脑”，使其能够自主规划、决策教育任务，使用教育工具执行子任务，感知多模态教学状态，调用学科知识库，自主或人机协同完成教学备课、协作学习、科学探究等复杂的教育任务。此外，通过多智能体协作与竞争，可以实现不同角色和功能的教育大模型智能体之间的信息交换和任务协调，形成具有群体智能的系统。例如，吴永和等^[12]提出了基于多智能体协作的“眼-脑-手”三维能力框架，以实现观察学生（眼睛）、数据分析与决策（大脑）、反馈和指导（双手）的协同。基于上述分析，本研究认为教育大模型智能体包括基于通用大语言模型智能体开发框架构建的教育智能体（如Kimi+）和教育机构中的专属垂域教育智能体（如EduChat）。

1 技术架构

教育大模型智能体继承了人工智能领域大模型智能体的核心技术与特征。大模型智能体技术架构包括大语言模型、规划、记忆、工具和行动等要素，具有自治性、反应性、主动性、社会性等特征^[13]。大语言模型智能体的推理能力（也称推理框架）是其规划任务、决策过程、调用工具和执行行动的核心，经历了思维链（COT）、思维树（TOT）、ReAct（Reasoning and Acting）等推理框架的演变。其中，ReAct以有效模仿人类学习新任务、做出推理或决策的过程，成为目前主流的大语言模型智能体推理框架之一，其核心思想是将推理（如思维链）和行动（如调用工具）交替协同进行，即通过思考（下一步做什么？调用什么工具）、行动（调用工具执行任务）、观察（任务执行的结果）的反复循环，使智能体在进行复杂内部推理的同时，还能通过观察反馈的结果调整其行为以适应不断变化的环境和需求。

本研究在参考大模型智能体技术架构的基础上，结合ReAct推理框架，设计了教育大模型智能体的技术架构，如图1所示。教育大模型智能体的技术架构包含智能体核心、教育任务规划、知识与记忆、工具、行动五个模块：①教育大语言模型（含多模态教育大语言模型）作为智能体核心，用于感知和理解师生输入的教育任务，包括文本、图片、音频、视频等多模态信息，驱动智能体检索知识与更新记忆、思考与规划教育任务、调用工具执行行动和观察行动的结果。②教育任务规划模块包含规划、决策和反思，其中规划主要指复杂任务分解，是将输入的教育任务分解为更小、更易执行的子任务；决策主要是行动计划决策，用于决定任务执行的步骤和需要调用的工具；而反思是指自我反思改进，即反思行动的结果，优化子任务分解，调整任务执行步骤。③知识与记忆模块包括短时记忆、长时记忆和混合记忆，其中短时记忆存储教育提示语；长时记忆利用检索增强生成（Retrieval-augmented Generation，RAG）技术，形成基于RAG技术的学科知识库；混合记忆则记录师生对话历史数据。④工具模块包括外部数据库、教育大模型智能体可调用的插件和其他大模型，用于扩展教育大模型的能力和知识边界，完成复杂多样的教育任务。⑤行动模块是基于更新的记忆和规划、决策的结果，选调工具执行诸如学术论文检索、代码执行、接入考试数据库生成试卷、调用数学大模型解答复杂计算题等行动。通过ReAct推理框架，教育大模型智能体首先读取输入的教育任务，更新教育提示语，检索知识库和对话历史数据，然后通过推理分解复杂教育任务，决策行动计划，最后调用工具执行行动，观察行动结果，通过反思迭代改进，直至输出任务最终结果，以此实现自主优化迭代，有效达成教育任务目标。此外，在输入教育任务后，上述教育大模型智能体还可与外部多个不同类型的教育大模型智能体进行对话与协作，或与教育环境交互，协同完成更加复杂的教育任务。

图1 教育大模型智能体的技术架构

2 主流开发框架与平台

对相关文献进行梳理，可以发现当前教育大模型智能体的主流开发框架有AutoGPT^[14]、HuggingGPT^[15]、AutoGen^[16]、MetaGPT^[17]、LangChain^[18]、InternGPT^[19]，而备受关注的热门开发平台是Coze^[20]、Dify^[21]。本研究根据官网信息、Github文档内容和已发表的相关研究成果，对以上开发框架和平台的易用性、功能性进行对比分析，结果发现：

①开发框架方面，AutoGPT和HuggingGPT具有开发成本低、可扩展性良好、集成了社区大模型等优势，适合用于开发自动化教育流程工具、学术研究工具和个性化学习助手等，但运行成本较高；AutoGen、MetaGPT、LangChain支持教育智能体定制开发，可用于开发多智能体交互式对话教学工具、多智能体学术科研工具、个性化学伴和教学助理等，但学习成本和开发技术门槛都较高；而InternGPT适合用于开发视觉交互的教育智能体和多模态交互学习环境下的视觉问题解答工具，但技术难度高，可扩展性和兼容性不足。

②平台方面，Coze、Dify平台支持零代码或低代码搭建智能体，技术门槛低，适合师生开发聊天机器人、个性化学习助手、教学助手、科研助手等智能体，具有可视化的编排界面，自定义技能、添加知识库和数据库、选择多类型插件和定制工作流等优势，缺点是未完全开源，难以实现私有化部署。

二教育大模型智能体的应用现状

自教育大模型智能体出现后，各国纷纷开始关注其相关技术的研发与教育应用，以提升教育的质量和效率。例如，瑞士洛桑联邦理工学院开发的ChemCrow可用于化学教学和科研辅助，美国麻省理工学院开发的ProtAgents可支持生物与医药学科的教学和知识发现，我国华东师范大学开发的EduChat适用于情感支持和苏格拉底式教学。为了呈现教育大模型智能体的应用现状，本研究引入国内外20个典型的教育大模型智能体（分别是AudioGPT、AVIS、ChatEDA、ChatEvl、ChatLaw、ChemCrow、CodeHelp、CoQuest、EduAgent、EduChat、EvaAI、HypoCompass、Kimi+、MapCoder、MWPTutor、PeerGPT、ProtAgents、ResearchAgent、SurveyAgent、WebAgent）进行比较分析，以提炼教育大模型的新特征、总结其应用场景，并介绍不同场景下的应用案例。这20个典型的教育大模型智能体呈现出了多样化的教育应用潜力，如ChatEDA、ChatLaw、MapCoder等可用于支持精准教学；EduAgent、PeerGPT、SurveyAgent等可用于支持协作学习和科学研究；ChatEvl、EvaAI可用于开展协同评价；WebAgent可实现自动化教务管理流程等。

1 新特征

智能导学系统（如AutoTutor、DeepTutor）依赖于领域专家构建的固定知识库，主要通过文本、语音和面部表情来感知学生的学习情况，支持个性化学科知识学习，但知识扩展有限，开发成本高；而教育大模型智能体（如EduAgent、EduChat）能够整合多模态信息感知师生状态，支持多样化教育任务，且跨学科知识易于扩展，开发成本低。基于此，本研究从多模态信息感知性、复杂教育任务适应性、跨学科知识扩展性和开发成本四个特征维度，对智能导学系统与教育大模型智能体进行特征比较（如表1所示），可以看出：智能导学系统更侧重于个性化学科知识的学习和教学内容的适应性，而教育大模型智能体能处理更加复杂的教育任务，适应多样的教育场景，具有更加先进的性能和巨大的教育应用潜力。基于此，本研究提炼出教育大模型智能体区别于智能导学系统的新特征：教育大模型智能体的多模态信息感知性强、复杂教育任务适应性高、跨学科知识扩展性广且开发成本低。

表1 智能导学系统与教育大模型智能体的特征比较

2 应用场景

本研究梳理了国内外20个典型教育大模型智能体的开发框架、大语言模型、调用工具、优势、不足和教育应用场景，以总结教育大模型智能体在教、学、管、评四大应用场景中发挥的作用，其中部分教育大模型智能体的基本情况如表2所示。

表2 国内外典型教育大模型智能体的基本情况（部分）

在深入分析国内外20个典型教育大模型智能体的基础上，本研究总结出教育大模型智能体在教、学、管、评四大应用场景中发挥的作用，主要表现为驱动精准化教学、支持个性化学习、优化教育管理与服务和促进教育评价智能升级。

①教学场景：教育大模型智能体驱动精准化教学。教育大模型智能体含有细粒度的学科专业知识，具备学科专业知识的检索与整合功能，能提供更加精准的教育反馈。此外，教育大模型智能体还可以通过调用工具感知多模态教学信息、接入学生学习数据库，有效识别学生的学习需求与状态，能为教师提供精准的教学决策，促进因材施教的真正落地，提高教育教学效果。例如，EduChat通过调用学科知识库知识，可以实现多学科的苏格拉底式教学；ChatEDA、ChemCrow支持个性化的学科知识学习和实验过程模拟，可以提高学科专业知识的学习成效；AVIS通过调用图像工具，可以构建图像与知识相关联的教学场景，提升学生的学习体验。

②学习场景：教育大模型智能体支持个性化学习。教育大模型智能体通过提供解决复杂问题的工具，支持学生的个性化学习。例如，CodeHelp、MapCoder通过提供代码执行器和结果分析工具，帮助学生在编程学习过程中获得即时反馈和个性化指导，从而提升编程学习的效果；HypoCompass通过提供“以教代学”支架，引导学生与智能体扮演不同的角色开展协作学习，可以提升学生的编程能力；而CoQuest、SurveyAgent通过多智能体协作支持的高效学术研究调查和人机协同提出研究问题，可以有效引导学生发现研究空白，进而辅助学生的科研论文写作。

③管理场景：教育大模型智能体优化教育管理与服务。教育大模型智能体通过API接口接入教育管理数据库并自动挖掘、分析数据，可以为学校和教育机构提供数据驱动的精准反馈与决策，从而实现高效的管理。例如，EduChat可以为学生提供专业的课程咨询、职业规划和心理健康咨询；WebAgent通过集成网页自动化工具和大语言模型，可以实现线上教育管理任务流程的自动化处理，提高了教育管理的效率和服务的精度。

④评价场景：教育大模型智能体促进教育评价智能升级。教育大模型智能体利用RAG技术将学生的学习成绩、学习过程记录等转为向量知识，自动评估学生的学习效果，可为教师提供精准的教学建议，并为学生提供个性化的学习反馈。例如，EvaAI可以通过多智能体协同自动化评分（如学生试卷自动评分、作业协同评分），提高教育评价的客观性和效率。

3 应用案例

为进一步验证教育大模型智能体的教育应用成效，本研究以探究式学习、编程学习和学术阅读场景的实证研究案例为切入点，阐明教育大模型智能体在人机协同解决复杂问题、辅助个性化编程学习和支持人机协同提问等场景中应用的优势与不足。

①探究式学习场景下的教育大模型智能体：在跨学科领域，为提升学生通过人机协同解决复杂问题的能力，翟雪松等^[33]基于情境教学法，构建了基于AutoGen的多智能体协作探究框架，并开展了有60名学生与7个智能体（包括教师、学习者和5类学科专家角色）组成的教研团队进行协作与探讨的实证研究，结果表明：相较于对照组（仅使用大语言模型进行协作对话，n=30），实验组（使用基于AutoGen的多智能体交互平台开展协作，n=30）的提问策略更丰富、因果推理更具逻辑性、问题解决方案更具创造性，能够有效提升学生探究式学习的广度和深度。但是，基于AutoGen的多智能体也存在吸引力不够、及时性不足等问题，难以在一线教学场景中有效地激发学生的学习兴趣和动力，学生也难以找到问题改进的方向和策略。此案例通过实证研究，验证了教育大模型智能体在提升学生跨学科探究式学习能力方面的有效性。

②编程学习场景下的教育大模型智能体：大语言模型辅助编程教学是大语言模型教育应用的重要形式，但存在错误率较高、学生滥用等不足。对此，Ma等^[34]开发了基于GPT-4.0的教育大模型智能体——HypoCompass，并开展了有19名学生参加的编程学习实验。在实验中，HypoCompass提供“以教代学”支架，通过角色扮演，让学生担任编程教师，而系统内集成的多个智能体扮演有编程学习问题的虚拟学生，“编程教师”需根据“虚拟学生”给出的编程问题描述提出假设、提供问题解决方案并做出反馈。实验结果表明，HypoCompass可以有效地提升学生的编程学习参与度与编程能力，但学生难以对包括编程在内的学科知识进行系统化建构，因而出现了系统化学科知识传授不足的现象，这不仅影响了学生对知识的深入理解和长期记忆，而且阻碍了学生形成扎实的学科基础和广泛的知识体系。此案例验证了在教育大模型智能体的辅助和支持下，学生的编程技能和学习参与度得到了提升；同时，案例中“以教代学”的人机协作策略可以为教育大模型智能体的教育应用提供参考。

③学术阅读场景下的教育大模型智能体：学术问题的发现能力，是研究生科研能力培养的核心。基于此，Liu等^[35]结合GPT-3.5、ReAct推理框架和Arxiv数据库，设计了科研问题共创智能体——CoQuest，并开展了有20名研究生参与的学术阅读主题教学实验。CoQuest按照“思考-执行-观察”的步骤进行决策，引入了研究者的心智模型，使得此智能体能够模拟研究者的思维，向学习者解释其生成研究问题的逻辑和推理过程，提升了反馈的可解释性。实验结果表明，CoQuest可以有效提升学生发现学术问题的能力。然而，在实际教学过程中，教师、学生和智能体CoQuest之间的协同作用不够紧密，缺乏有效的组织和协调，可能导致智能体难以达到预期效果。此案例验证了教育大模型智能体在学术阅读主题式教学中提升学生科研能力的有效性，以及人机协同提出研究问题的方法和互动模式在即时反馈、支持学生自主学习方面的应用潜力。

三教育大模型智能体的未来展望

1 教育大模型智能体应用面临的机遇与挑战

一方面，教育大模型智能体为科学探究、协作学习、社会情感学习和学生高阶思维培养等带来了重要的发展机遇：①教育大模型智能体可用于辅助科学探究，其通过调用学术工具快速检索和总结文献，生成文献综述，使巨量复杂的文献信息更易于获取、筛选和理解。②教育大模型智能体可以协助提出研究问题或研究假设，提升研究项目的质量，并能够引导学生开展高效的协作学习，故将在协作学习中发挥重要作用。例如，在多智能体协作的学习场景，教育大模型智能体可以扮演主持人或总结者的角色，帮助组织、监督协作学习过程，对学习情况进行总结与评价，确保协作学习的成效^[36]。③教育大模型智能体可以支持社会情感学习，通过监测学生的语言模式，提供情感支持，引导学生进行自我反思。当学生表达沮丧、压力或困惑时，教育大模型智能体还能及时识别问题并向教师提供干预建议。④在培养学生的高阶思维能力方面，教育大模型智能体也将发挥重要作用。例如，在学术阅读、写作、提问等场景中，教育大模型智能体可从不同角度启发式引导学生理解复杂的概念、开展辩论或案例研究，促进更深入的分析，助力学生创新能力和批判性思维能力的培养^[37]。

另一方面，教育大模型智能体存在个性化反馈能力不突出、教学场景的融合不深入、学科知识的传授不足等挑战。现有的教育大模型智能体未能充分融合学习者模型、专家模型和领域模型，故难以在认知、情感和元认知层面提供能够激发学生学习动机、增强教学互动、改善学生情感体验的个性化反馈信息^[38]。当前，师生的人机协同素养不高，对于AI工具的教育价值与危害认识不足，对于教育大模型智能体这一新技术工具在教学一线开展规模化应用的效果也存在疑虑，导致未能将教育大模型智能体深入融入教学场景。此外，教育大语言模型在训练数据的过程中也存在学科知识规模小、细粒度不够、模型结构与学科知识特征未进行匹配与优化、长文本理解与逻辑推理不足等问题，导致教育大模型智能体在学科教学场景中的应用受限。

2 教育大模型智能体应用的未来前景

在教育数字化转型的过程中，教育大模型智能体凭借其技术先进性和新特征，将成为引领教育思维方式、教育组织生态发展变革的新风向标^[39]，有助于突破传统教育信息化建设所面临的“天花板效应”^[40]。教育大模型智能体在教育领域的应用，应牢牢把握学校数智化转型背景下的“教育性”这一本质特征，以促进学生高阶思维发展和教育全场景数智化发展为目标，驱动教、学、管、评四大应用场景的教育大数据集成为有价值的教育知识库，为教育大模型智能体的发展提供可靠的数据与方法基础^[41]。

教育大模型智能体是在现有的技术基座之上，联同智慧教育多元主体构建的教育大语言模型、教育工具库、教育智能体等资源，面向教、学、管、评四大应用场景的新一代生成式人工智能技术，可作为学校数智化转型的新驱动力。展望未来，可以结合学校实际，将教育大模型智能体与在线学习平台、教学平台和管理平台深度融合，研发有温度的个人助理、数智分身、课堂智能助手、具身教育机器人等智慧工具^[42]，实现不同教育主体之间的去中台式互联互通、多模态教育数据的智能化分布式管理；同时，可以通过相关培训项目，提升师生人工智能素养，依托零代码开发智能体的平台设计教育大模型智能体，开展人机协同教学活动，最终以“人人都有一个智能体”的形态，推动教育大模型智能体与教育教学深度融合，真正实现学生的个性化学习、教师的差异化教学、学校的精准化管理，驱动学校实现从信息化到数智化的转型。

四结语

在教育数字化转型和人工智能教育应用浪潮的推动下，教育大模型智能体将对教育教学实践产生深远影响。本研究从技术角度介绍了教育大模型智能体的开发情况，呈现了其应用现状，并对其未来前景进行了展望，相关研究成果可为教育大模型智能体赋能教育教学全过程提供理论与实践参考，并为人机协同教育发展提供新思路。后续将利用知识图谱和多模态技术来优化教育大模型智能体，更大程度地发挥教育大模型智能体在教、学、管、评四大应用场景中的积极作用，以激活教育新质生产力，加快推动教育数字化转型，实现教育高质量发展。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

刘明 等 | 教育大模型智能体的开发、应用现状与未来展望

刘明等 | 教育大模型智能体的开发、应用现状与未来展望