从“刷题家”到“学伴”:AI如何彻底改变未来教育?
发布日期:2024-09-27 06:19:35
浏览次数: 2285
来源:彩虹之眼
这两天Sam Altman在X上发表了一篇题为《The Intelligence Age》的小作文(原文链接:https://ia.samaltman.com/),在AI圈流传甚广,这篇文章比较长,而且信息也非常宽泛,有网友概况并提取了文章中的6个要点分别是:1.人工智能将成倍地增强人类的能力,实现今天看似魔术般的成就。2.社会是一种集体智慧,人工智能将极大地放大这种共享智慧。3.深度学习的可扩展性是人工智能快速发展和潜力的关键驱动力。4.人工智能驱动的智能时代有望实现前所未有的全球繁荣和问题解决。5.获得充足的计算和能源对于实现人工智能民主化和防止不平等至关重要。6.控制人工智能的风险对于最大限度地发挥其优势并确保积极的未来至关重要。当然笔者今天写这篇文章的目的也并非是要吹嘘一下最近openAI发布的o1模型有多么厉害或者多么神奇,而是看到Altman文中提到的智能时代有这样一句话:“我们的孩子将拥有虚拟导师,能够以任何语言和适合他们的节奏提供个性化的教学。类似的概念还可应用于医疗保健改进、创建人们想象的各种软件等领域。有了这些新能力,我们可以共享前所未有的繁荣。”读到这里自然就联想到最近一段时间以来,笔者一直在不断思考的一个问题,下个AI时代的教育到底应该是什么样子?那么,今天就借助奥特曼这篇文章的标题做一个具体的延展对The Intelligence Age‘s Education做一次深度的思考! 在畅想之前,我想简单聊聊人们为什么会对下个AI时代的教育怀有期待。谈起教育,我相信大部分人都对长时期以来的题海战术、考试制度、运行体系等等提出很多的或尖刻或温和的批评。似乎大家都非常了解应试教育体系之下不断内卷产生的种种弊端,但是对于如何解决这种弊端同时还能保证教育公平又显得无能为力和乏善可陈。举个最典型的例子就是刷题,比如下面两张图是人教版的小学三年级上册数学课本,满篇的题目可以说是从头到尾。我们的教育改革实践这么多年过去了,以刷题为核心的应试教育体系依然不可动摇。以至于后来慢慢演变出一个新的词语叫所谓的“小镇做题家”。其实我这里并不是想讨伐刷题不好,在目前的考试标准和形态之下,暂时还没有比刷题更高效,更具性价比的应试方法。但是这种以试题作为升学考试唯一标准的选拔方式的负面影响确实越来越大,典型代表就是在这套体系下培养出来的学生,创造性能力和创新性思维相对较差的情况,这种弊端在研究生、博士生阶段体现的更为明显。而且还有一个更为严重的问题是,无限内卷刷题会孩子们对让学习本身越来越丧失兴趣。平心而论当下的教育资源要比10年前,20年前信息不发达的时候充裕的多,今天在知乎、B站、douyin还有海外教育平台上都可以随处找到非常优质的课程与教材。但是我的感受却是这一代学生的学习能力并没有特别明显的跃升。而对于哪些在时代的洪流下的小镇做题家们来说,通过刷题来到大学之后迎来的不是打开新世界的大门,反而是愈加的迷茫与无所适从。诚然很多朋友也许会说,觉得应试不好可以选择出国,可以留学。我知道对于一二线的很多家庭来说,走应试的路线并非唯一选择,但是与此同时哪些三四五六线城市成长的“小镇做题家”们,真的没有太多的选择,除了往死里卷,其他的可选路径并不大多。 当然我这里并不是要来批判当前教育体系之中的种种弊端,毕竟在大的体系之下,个人的力量是微不足道的。我这里主要是想说明的是在现有大环境之下,除了往死里卷自家孩子的家长之外,还存在着自己不想卷,但是在社会、老师、同学等外部压力之下不得不卷的那一部分家长。对于这部分家长来说,看着孩子卷也难受不卷更难受,似乎没有其他道路可以选择了。如果没有这波以chatGPT为代表的生成式人工智能技术的爆发与出圈,真的不知道这批被外部力量推着内卷的家长们如何应对。好在chatGPT恰逢其时的出现了并且破圈了。我相信体会过大模型能力的诸多的教育工作者都明白大模型技术的不断进步,对于教育的冲击意味着什么。但与此同时,虽然大家普遍都看好AI对各行业应用领域的赋能。在LLM技术不断迭代进步的同时,市场上却并没有诞生出一款所谓的Super APP出来。于是市场上不约而同的会有声音出来嘲笑这波AI浪潮会和之前的web3和元宇宙一样是飘在空中的美好愿景,而并非是脚踏实地改变生活的生产力。特别是前阵子自媒体圈弥漫着对AI“六小虎”的悲观预期,甚至著名投资人朱啸虎在接受采访时都公开表达了AI“六小虎”最好的结果是卖给大厂(原文链接:https://www.huxiu.com/article/3406822.html)。 对此我个人是不赞同朱啸虎的言论的,感觉他说的内容虽然比较务实,但是有一句话说的特别好,悲观的人通常是正确的,但最后的成功者往往是乐观的。起码我觉得如果这波AI技术浪潮下,最后的赢家如果还是上一波移动互联网时代的巨头的话,这个世界也太无趣同时也让创业这个事情让人感到无比绝望与悲观了。 如果我们回望在移动互联网领域中崛起的这几大巨头,无论是淘宝、京东、滴滴、美团、还是后面崛起的字节、拼夕夕,无一不是靠解决人们衣食住行这几大刚需问题而崛起的(字节表面上短视频娱乐,实际盈利还是靠直播带货),而我个人觉得所谓Super APP迟迟没有到来,归根结底的原因是目前AI解决的痛点就不在衣食住行或者生产制造领域方面的刚需问题。现在AI在实际落地应用的过程中一个较为明显的效果就是降本增效,而且实际场景汇总一下多数的增效是靠减少人员岗位、减少不必要的开支等降本方式来实现的。对于生产端的增效确实比较乏善可陈。目前国内的生产制造端可以落地的大模型除了以华为为代表的一系列工业大模型之外,其他并不多见。而且华为的工业大模型主要的落地场景还是在大国企和巨型央企,因此普通人对生产制造端的大模型落地提效感知也比较有限。那么大模型应用落地场景中未来可见的时间内,就没有普通人感知比较强的领域了吗?我的回答是:有!而且这个应用场景目前我个人觉得最靠谱的就是教育。回过头来看上一代的移动互联网巨头中基本是靠解决民生刚需问题崛起的,那么我觉得这波AI浪潮要想诞生巨头依然还是要从解决刚需问题切入,而民生刚需的应用场景中除了衣食住行之外还有教育和医疗两大板块。相比于医疗而言,无论是风险还是容错率教育无疑相对来说更加容易一些,诞生AI时代的Super APP的机会也应该更大一些。另外还有一点LLM本身就是一个知识密集型的产物,而我们传统教育体系内,老师的传道、授业、解惑这三大主要角色,中授业占得比重过高了。因为现在教师的教学评定直接和考试成绩挂钩,所以老师们不得不花费大量的精力在讲知识点,布置习题,不停的强调抓成绩,抓分数,而在传道与解惑上投入的时间与精力都显得略微不足一些。而大模型的出现,在未来AI技术赋能教育的实践中确实应该可以帮助老师们适当的从授业的困境中解脱出来一些。让老师们可以更加关注个体的成长!同时作为那些被迫进入教育内卷序列的家长来说,技术的进步也使得寻找内卷与躺平之外的第三条路逐渐成为可能。作为教育行业的一名从业者,我个人是非常期待有一款划时代意义的AI教育产品能从技术上对教育场景做一次深入的赋能的。但是下一代的AI教育产品应该是什么形态?ta应该拥有什么样的功能?重点去解决哪些问题?用什么样的形态与用户进行交互?仅就目前的市场情况来看,我还没有看到一款真正属于AI时代的学习产品的诞生,无论是学习机,学习笔的硬件还是各种网站或APP的软件,我认为都没有达到我个人对下个时代AI学习产品的想象。比如国内一线品牌的众多学习机类产品,硬件形态都是pad,交互方式仍是传统的APP形式。这种产品形态即使拥有了LLM在产品力上的加持,但是对于用户而言,依然略显冰冷僵硬缺乏温度。那么除了类ipad这种学习机的产品形态之外,是否还有其他可能?这个问题在openAI于5月份的GPT-4o模型发布会上,邀请了可汗学院的创始人Salman Khan和他儿子一起使用了GPT-4o辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!这可以说是openai第一次将多模态模型能力在教育场景上落地应用的尝试。虽然演示视频中仍然是以一台搭载了GPT4o的ipad作为使用终端,但是我个人觉得这种产品形态应该并非是最终的版本答案。 [OpenAI 邀请了可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题]但是基于这个场景,我个人认为可以从此出发更多的去畅想一下,未来下一代的AI学习产品该有的样子。首先,我们来看交互方式。传统的学习机或学习应用的交互方式,还是停留在移动互联网的APP的交互逻辑层面。即需要用户来主动搜索、点击、探索整个产品or应用的全部功能。我们目前可以触达的学习类产品or应用,在交互层上都还是以机器或者工具的思维在设计,需要用户自己来规划学习任务。这就使得整个交互的过程中,缺乏温度,非常的冰冷。在我个人心目中的下一个时代的AI学习设备or应用的交互逻辑应该是具备主动性、具备学习任务规划能力,并且可以和用户共情的。下一代AI学习产品的定位不应该还是简单的助手or工具的属性,而更应该接近用一个类"人"的设计思路重新打造。特别是身份定位上,应该从一个“老师”(Teacher)的定位转向成为一个“学伴”(Learning partner)的定位。比如以知识讲解的过程为例,就可以从传统的"老师"授课,用户跟着学的范式转换为“老师”提出问题,用户和“学伴”一起沟通交流,动手动脑一起探索解决问题的思路,最终到达思考的终点来解决问题。在这个范式之内,“老师”的角色可以在后台由有着非常多年教学经验的真实老师来负责,而“学伴”的角色可以交给AI来完成。然后,我们再来讨论一下,到底什么才是“学伴”,各位小时候相比都看过一部很有名的动画片《哆啦A梦》,很多人小时候可能会幻想自己拥有一个哆啦A梦一样的朋友,可以帮助自己实现很多的梦想。比如下面这张漫画中的道具就已经集成了目前AI技术中的图像扫描,文本识别,图像训练lora或checkpoint,文本嵌入大型语言模型,思维链控制大型语言模型生成故事、切分台词、生成绘画提示词,绘画模型根据提示词绘画,如果台词不能直接画进画面里还需要叠加图层,最后打印输出。 好的AI学习工具or产品就想哆啦A梦里面的机器猫一样,ta不仅有很强的实用性可以帮助学生解决很多实际的问题,ta还有非常强情感陪伴属性。ta不只是一个学习的百宝袋,还是一个拟人的机器猫。一个好的AI学习工具or产品不仅仅需要非常强大的知识储备,解析能力,同时还应该具备陪伴用户一起探索未知、刨根问底、深度思考的情感链接属性。一旦这种产品落地,如果有人问AI有什么用?那你真的可以反问他哆啦A梦对大雄有什么用来回答了。因此“学伴”给用户带来的价值不仅仅是教会知识,而是陪伴用户一起成长,深入体验过AI目前在数学和逻辑推理能力上的朋友可能都非常清楚,目前即使是能力最强的o1在复杂问题的推理成功率上仍然是不可用的。举个简单的例子如果让一个大模型把一个复杂任务分解为 10 个步骤,哪怕单个步骤的正确率高达 95%,要想最后把任务做对,10 个环节的准确率连乘下来,最终的正确率只有 59%,惨不忍睹。那有了 o1 是不是这个方向就前途坦荡?也是也不是,o1 的 Model Card 专门测试了 Agent 任务,对于简单和中等难度的 Agent 任务有明显提升,但是复杂的、环节多的任务准确率还是不太高。但是以o1为代表的这种类似左右互搏的self-play RL 增强逻辑推理能力的方式未来的上限会非常高,我们应该有足够多的耐心,等待强推理能力模型的不断迭代进化。 当然目前在AI“学伴”这个思路之上做学习应用探索的项目已经有不少落地应用的了,比如我看到的有一款 AI 儿童英语产品 Heeyo这个由 AI 小恐龙带你冒险的游戏化产品相当的有趣。AI 会让你选择一些小游戏,选择之后 AI 开始带领你探险,探险过程中 AI 会不断提问交谈,还有实时文生图,沉浸感加分,全程全英文语音交互。这种产品形态非常适合用在低龄段的学习场景,这也非常符合我一直以来对AI学习机or产品的一贯态度就是,AI学习机首先需要是一台AI游戏机,用户在游戏中规划学习任务,探索实现方法,最后获得任务奖励。这才是最符合人性的学习路径。站在当下的视角来看,教育资源的获取已经比之前简单方便许多,但是在激发学习兴趣的探索上,似乎并没有取得特别明显的效果。虽然这个和前文所述的当前考试制度下的内卷有非常大的关系,但未来我们确实应该更加重视如何使用AI技术来激活学习兴趣。 如果说这个新的范式在之前还更多的是在幻想或者畅想,那么在模型多模态能力曲线越发陡峭,openAI发布可以拥有系统2慢思考能力的大语言模型o1之后,这个范式离落地应用应该是越来越近,越来越靠谱了。大语言模型基础的能力有四个方面 :语言理解和生成、世界知识、工具调用以及逻辑推理能力(包括数学、Coding、推理等理科能力),o1给大模型带来了自我反思与错误修正能力,如果你分析过OpenAI官网给出的Hidden COT例子的话,会发现它确实能意识到之前犯错了,并能自动进行修正。这种自我错误识别与修正对于LLM能做长链思考及解决复杂任务非常重要,而这个能力在教学场景下就会显得尤为珍贵,正是因为在o1上看到了LLM具备了慢思考和自我纠正的能力才能使得AI和用户成为“学伴”的可能性不再是天方夜谭。同时在LLM不擅长的知识更新和数学计算层面,结合LLM调用外部搜索引擎和python计算器的能力,可以给专注于逻辑推理的强思考能力型大模型释放出更强的解决问题的能力,而这一点正是我们当下的AI赋能教育场景中特别期盼的能力点。尽管目前o1在解决复杂数学推理问题的过程中不像openAI官方宣传的给人感觉特别神奇,逻辑推理的过程也非常的神秘,只有一条条的summary似的概要。但是从AlphaGo从最开始的蹒跚学步到最后战胜所有人类选手的时间线来预测,采用Monte Carlo Tree Search(蒙特卡罗树搜索)+Reinforcement Learning, (RL 强化学习)的方法,确实是可以让大模型快速找到通向正确答案的路径。比如下面这道测试o1推理能力的试题:海龟汤问题。一名男人发现自己少贴了一张邮票,随后便去世了。请问发生了什么事? |
海龟汤是一种推理游戏,出题人给出简短、模糊的故事背景,由玩家自己主动提问。出题人只会回答“是”和“不是”,然后玩家根据出题人的回答,结合自己的推导,给出故事的真相。我们给了o1-preview五次提问的机会,然后让o1-preview尝试推理真相。每一次提问,o1-preview都考虑了十几秒,层层递进。 在问了3个问题后o1-preview直接就给出了答案这道题的标准答案是,男人寄送定时炸弹给仇人,但因为少贴了邮票,炸弹又被退回,结果一爆炸,炸死了自己。o1-preview 的方向是对的,稍显缺乏了一些准确和完整,少了一些细节,但很接近正确答案。但是我们需要清楚的认识到一个问题就是o1这一类强推理能力大模型并非是针对教育场景专门打造的,因此就未来的AI学习产品的能力层除了拥有大模型之外,还需要拥有其他的基础设施。包括但不仅限于具备学习任务规划能力的小参数规模模型。意图识别模型,多模态交互模型,以及搜索引擎,既有的知识库等等。而采用什么样的方式来构建这套面向未来的基于AI技术的教育体系的过程中,我特别推崇的是Scratch少儿编程平台的创始人米切尔·雷斯尼克教授在《终身幼儿园》一书提出的创造性学习的4个根本法则:项目(Project)、热情(Passion)、同伴(Peers)和游戏(Play),即4P法则。这里我想围绕着4P原则中的project简单聊聊最近非常火热的一个词项目制学习(Project-based learning,PBL),这里首先给项目这个词一个基础的定义:项目是指具体的、有实际应用价值的产品或可展示的作品,产品的形式可以是多种多样的,既可以是实物/硬件产品,也可以是技术/软件。它实际是完全不同于传统分科教学中以传授知识为主的教学方法,它强调为学生提供真实问题情境、项目任务,激发学生在解决问题、完成项目任务的过程中,探索、建构、运用跨学科知识,“做中学”是项目学习的核心。 基于以上4P原则的整体思想,如果采用PBL项目制的学习方式,除了深度推理模型之外,我们还需要有一类非常强的路径/任务规划能力模型,可以将知识体系拆解为具体可以执行落地的项目,然后和用户一起来探索和规划可执行的学习方案(Learning Plan),而且我甚至认为这整个探索、规划、执行的过程中,不单单只是由AI与人类共同协作,这里还应该包含AI与AI的协助,人类与人类的协助。这应该是一个multi-Human&Agent协作模式。才可能迸发出更多的创造性。并且在任务执行层,AI还需要制造,调用外部工具来完成任务。这个部分在未来的人机协同场景中也存在非常广阔的空间。当然要做到以上几点,以目前的技术来看仍然非常有难度。但是在LLM的能力层不断迭代特别是多模态能力的不断进步的背景下,作为下一个AI时代的教育产品设计思路与方向确实需要打破既有的思维定势,突破常规重新审视的。
说了这么多AI,让我们回归现实社会,再聊聊真人老师在未来AI时代的教育场景下的角色定位以及如何应对。首先我想明确的一点是,AI的进化速度确实令人心生感叹,AI圈一直流传着AI一天,人间一年的说法。但是我们不应当去过度的传播焦虑,特别是AI的许多技术的showcase到落地实际使用还是有非常大的GAP的。如果你是一名老师或教育工作者,更值得关注的是AI技术在某一个具体场景下的应用,另外就是需要适应新的体系之下,学习内容、学习方法、学习形式、师生关系的转变 学习内容:需要适应从单纯的学科核心知识向学科知识结合基于真实需求的项目任务或有现实意义的问题的转变。学习方法:需要做好从学生被动学习向主动学习的转变。学习形式:需要准备从学生个人独立学习向团队学习,小组学习,人机协同学习的范式过渡的转变。师生关系:教师需要从知识拥有者、传授者向项目设计者、活动组织者、知识学习者的过渡与转变。我始终坚信,教师除了授业本身之外,更值得在传道与解惑两个维度上在学生身上值得花费更多的时间与精力。这也是单纯靠技术永远无法替代的教师的核心作用,因此真的不必去焦虑,但是确实一个新的时代呼之欲出,所有教育工作者应该尽可能多的提前学习,提前了解,提前适应。最后,我推荐各位有时间可以去读一读可汗学院创始人的新书《 Brave New Words: How AI Will Revolutionize Education》中文翻译为《勇敢的新词:人工智能如何彻底改变教育》,Khan 在 2022 年夏天就用上了 GPT-4, 比公众早了整整 1 年,用书里面的话说 「如果你在大多数人仍然认为它是玩具或者噪音的时候进行投资和测试,你就能在它准备好迎接主流时真正获得它的好处」同时书中还有一句话也送给所有的教师和教育工作者们:「人工智能在教育领域的未来将与科技合作,让教育变得更好。在广阔的语言世界中,没有比教学更安全的职业了。人工智能并不是为了抢走老师的风头而存在的,而是为了帮助老师抢风头。」
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业