微信扫码
与创始人交个朋友
我要投稿
在这篇文章中,我想聊聊 AI 如何改造教育的流程和环节。
/ 01 /
什么是 Agent、Multi-agent
教育环节众多,例如批改作品、课中分组、课中课后答疑、课程/单元/教学设计、授课、培训。在 LLM(大语言模型,如 GPT4 等)之前,许多环节都需要人来执行,例如,我们要自行规划和撰写学习目标,授课过程中和课后要做好各种形成性和总结性评价工作。
在所有需要人参与的环节中,我们都需要感知当前的环境,生成目的和规划,然后借助自己的短长期记忆中的专业知识和技能,设计特定的流程,使用工具解决问题,并监控活动的进展情况。例如,在解决学生课中的问题时,你要先感知当前教学进度,预判学生困惑的可能卡点,然后借助记忆中的脚手架专业能力或脚手架工具,设计独特的问题链,并监控学生在问题链的表现,及时调整问题链。执行这个智能过程的主体被称为智能体(Agent)。
如今大语言模型(LLM)发展迅猛,它具有很强的推理能力,其能力边界一方面体现在于上下文窗口,也就是说,上下文太长会导致前文的短期记忆丢失;另一方面,LLM 缺少感知能力和问题分解的规划能力。LLM 就像一个待在小黑屋中的人,你问他一些简单的问题,他信心满满地回答,如果你的问题一复杂,小黑屋里的人就有可能胡说八道,我们称这种情况为幻觉(hallucination)。
解决这三个问题的方法有:第一,使用一大堆智能体来降低上下文窗口的限制(还可以借助其他技术手段来增强长时记忆能力如 RAG);第二,把外部工具运行结果输入给LLM来增强感知能力;第三,借助多智能体协作来增强LLM的规划能力,避免在提示词(的 #Workflow 中)写下太多流程。
Langchain 的创始人梳理的 Agent 能力图
图中 Agent 拥有调用工具(Tools)的行为能力(Action),并将工具运行结果返回 Agent 的记忆力(Memory),并通过一些技巧来增强 Agent 的规划能力。
吴恩达在最近的演讲中提到 Agent 四种设计模式,分别是反思(Reflection)、工具(Tool use)、规则(Planning)、多智能体协作(Multi-agent collaboration)。
吴恩达提出的四种 Agent 设计模式
这里主要关注多智能体(multi-agent)。斯坦福小镇是一个非常形象的多智能体案例,这个 AI 小镇中有25个 agents,每个 agent 都扮演不同身份、性格、年龄的角色,它们受到提示词的指挥进行着自己的活动,也像人类一样彼此交流。
斯坦福小镇,每个小人都是一个 Agent 智能体,他们有自己的行为和记忆
多智能体就是一群智能体的协作,用程序将它们的流程组织起来,以解决更复杂的问题。这和教育环节中的复杂流程配合是一致的。用智能体优化流程,或者说本文关注的教育流程,就是把各个 Agent 梳理出来,配上合适的工具、行为、记忆,将流程中的各个环节模型化,以此降低重复劳动的压力,发挥人的优势。
/ 02 /
教育流程和环节梳理
因为我个人熟悉的是 线上、K12、编程教育 这个教育环境,下面仅以此为例进行梳理。实际上,任何教育环境,甚至教育之外的领域的道理都是相同的。我将自己熟知的教育环境分为课前、课中、课后三大板块,完整图示如下。
从下向上依次是课前、课中、课后
首先是课前板块。课前分为两大部分,第一部分涉及课程资源的制作,这类工具现在较多。这里主要讲解课程设计板块。
课前 Agents
当课程产品定位清晰后,就要进行课程设计 → 单元设计 → 教学设计,整个过程还包括各层级目标设计、评价设计,在教学设计层面还涉及教学评一致性检查、核心教学案例、变式练习题等任务。这些都可以由 Agent 代劳。不过考虑到这些工作的流程交织,而不是瀑布流,所以我暂时认为这些 Agent 可能比较适合独立运行。
下面的图片来自我在23年9月关于单元设计方法论演讲,它展示了如何使用 LLM 做基于义教信息标的单元设计,包括目标设计、评价设计、教学评一致性检验等工作。
图片较长,点击查看
课中部分的流程性较强,虚线暗示了教学实践的流程。
课中流程类 Agents
学生在上课过程中,可以和不同环节的 Agent 交流,每个 Agent 各司其职,其背后的行为、工具、记忆都包含了 Agent 设计者的智能,所以可以更好地帮助学生。因为和 Agent 的交流过程被记忆,所以为有据可依的半自动/自动化的形成性/总结性评价都做好了准备工作,甚至为下节课的因材施教、自动化推荐都做好了准备:学生在课后可以得到由 Agent 设计的针对性练习题,下节课前的预习材料可因人而异。这些环节数据是学生宝贵的数据资产。
在课中,还有一些 Agent 并不随着流程在执行,而是持续执行特定任务。例如,监控学生的创作能力是否受阻,监控是否存在不当言论,监控学生是否主动指出 AI 的信息是错误的等。
创作受阻用编程语言很难实现判断,但是通过自然语言却很容易,这件事情可以交给 LLM 来做推断;(如今计算思维教育中,常常使用编程语言作为主要工具,在 K12 中强调创造力,所以监控创作过程至关重要;实际上,对于其他领域的监控都是同理)
不当言论不必多说;
AI 时代下批判性思维的培养被提升日常,实践中也有很多学科老师会关注 AIGC 的合理性,比如根据史实生成历史图片并做批判,或者干脆让学生批判 AIGC 的结论,或要求学生使用 AIGC 做作业并通晒和批判 AIGC。
课中监督类 Agents
在课中还有另一个板块:学生相关的服务。例如,单课、单元、多单元的学习档案袋,衡量自身成长的增值评价,更多维度的多元评价,考试模拟题等等。以前由人执行的工作,现在都可以借助学生学习过程中产生的数据,由AI协助人来完成。
学习服务类 Agents
最后是课后的教学服务板块。对于公立校老师而言,下图可能并不敏感,但是对于机构来说,商业良性循环才能更长远地发展。
课后教学工作类 Agents
老师们和家长的沟通策略和方法可以通过知识库中的销冠话术自动生成,且在企微触达家长时,都可以借助 Agent 访问工具的能力达到自动触达,撰写学习报告、批改作业都也可以借助 AI。管理层对老师的监督和培训同样有数据可依,也可以借助 Agent。
/ 03 /
用工具改变思维
彼得·圣吉在《第五项修炼·实践篇》引用过一句话:“要想教给人们一种新的思维方式,就不要刻意去教,而应当给他们一种工具,通过使用工具培养新的思维方式。”为了阐明图中的思想,我花了两周多时间使用 Multi-agent 框架制作了一个简易原型工具。考虑到原型中涉及一些商业信息,我仅以脱敏的图片呈现。
假设课前资料和设计工作已经准备就绪,下面进入课中。
在课中环节服务的 Agents
图片左侧是教学环节,每个需要交流的环节都有一个小 Agent 驻守,它专门负责和学生交流该环节内的问题。图中右侧是学生和所有 Agent 的沟通记录。整个交流过程非常自然、专业、亲切,苏格拉底式循循善诱,以至于我会问自己:这种模式是否比真人老师更关注学生?学习结果会比真人老师差吗?老师在这种教学模式中的职责是什么?
为了增强 Agent 的智能(聊天框中采用了半自动化的 ReAct 算法),我在提示词中要求 Agent 检查学生是否运行了代码,如果运行,则再将运行结果并嵌入提示词来拓宽 Agent 的感知力,以此减少幻觉。
在课后,假设老师要撰写学习报告并发送给学生,有一个 Agent 专门负责此事。首先要做好 Agent 配置,它的配置是一份提示词,也就是这份学习报告的结构和关注点。
配置执行某个课后工作的 Agent
然后该 Agent 会总结上图学生与所有 Agent 的聊天内容,并按照提示词中设计的评价维度进行评价。老师在后台发送教学工作指令。
最后该 Agent 将自动发送学习报告到微信。(这个 Agent 使用的是全自动化的 ReAct 算法,会自动加载4个外部工具,包括通过姓名获取学生id,根据学生id获取企微用户id,根据学习过程撰写报告,发送学习报告到企微用户id。)不同认知能力学生的评价结果不同,而且关注到到了学习过程中的细节,并非来自幻觉的胡言乱语。
低认知能力 和 高认知能力 的学习报告,评价有据可依非幻觉
按照 Multi-agent 思想(目前有大量新兴MA框架,如LangGraph、MetaGPT、AutoGen、crewAI、AgentScope),它支持设计更多课后教学工作的 Agent 来提升学习体验,协助老师工作,整合入学校或企业网站中。这种工作模式将需要更多懂学生、懂课程、懂单元、懂评价的老师,来设计更合理的评价活动,从学生数据中挖掘有价值的信息,设计好的学习体验等。
未来人们不再需要执行流程,而是设计、选择、监督、评价、优化流程,执行流程则交给其他计算代理们。类似 Devin 的自动化AI程序员的出现并非说不再需要程序员,恰恰相反,是更需要程序员了,只不过需要的是能力更强的程序员,具体说,是具有产品能力的程序员,他们需要定义问题、梳理需求、设计原型和用户沟通,然后借助 AI 一键生成完整程序。
所有涉及人的推理的环节,无论教育领域与否,都可以被 Agent 化一遍,以及让众多 Agents 协作,共同完成复杂流程。教育 SOP 虽有共性,然差异依旧很大,不同学校机构流程不尽相同,这其中应该有很多机会。
培养新的数字素养是当下AI时代的重要任务,老师和学生更要学会使用 Agent 提升自己的工作&学习效率,以及提高物质产品和精神产品的质量。(这让我想到了信息技术工具论的旧时代,那个时候软件众多,初步理解并会使用它们是那个时代社会对教育的需求;就如同今日,面对新的交互工具,会使用它的基本技能或许都是社会对教育的需求;在未来当工具使用已成常识,能调配 Agents 协作或将会是下一个需求的方向?)
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-04-25
2024-05-14
2024-07-18
2024-04-26
2024-08-13
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19