Sam Altman在「Moore's Law for Everything」中,把教育、住房作为了未来会每2年价格降一半的例子。OpenAI投资了Speak等创业公司,也和duolingo,Khan Academy深度合作。包括Sam,陆奇等不少观点把教育列为这一轮 AI 革命产生新价值最大的行业。然而从市场角度看,教育行业并没有足够大的热度。产品常规的工作是确定约束条件并找到满足核心约束条件的最优解。因此本文将要梳理在GenAI技术浪潮下,教育行业迎来大变革需要的前提和近几年的路径。
零、语言场景是低枝果实
语言场景下,近一年内发布且上了AppStore榜单的,以大模型为技术基座的有智能口语大师,TalkAI练口语,Hi Echo等几个产品。语言是大模型的长板,这个方向主要看大模型,应用的技术壁垒薄也带来门槛低。正是因为无法形成垄断头部,只要能拿出有差异化的好产品,都可以在这个垂直市场去试一试。
市场&需求明确&10倍成本降低:欧美外教一节课学费至少100起,菲律宾外教学费50起。仅在口语对话上,大模型产品的体验是可以覆盖掉80%的外教对话需求的。
技术场景匹配:利用到了大模型长于语言理解和生成的能力,并且语言学习场景强调互动,学习者对事实的正确具备包容性,套壳大模型+Prompt就能用。而且多样的Prompt正好可以解决鼓励开口、地道发音等多种场景。
没有时间窗口:供给侧没有稀缺资源,消费侧没有网络效应——即便假设国内市场有公司依靠投放和重人力资源投入搞出了高DAU和体验领先的头部产品,但只要新一代多模态大模型出来,就会出现新的机会。
应用设计空间大:当前几个应用都是简单的场景预设+TTS,部分产品有数字人,几乎没有差异性。然而对大部分有口语学习诉求的中国用户最大的挑战是:用户要用自己本身掌握不多的单词去组织起来有效的沟通,而bot代表的自然语言交互优点是自由度大但缺点是可理解差,教育产品是需要具象和引导用户的。因此bot不是最好的口语场景设计,设计空间还是比较大的。
可以预见,市场需求明确能变现的口语场景在24年会出现更多的套壳大模型的产品,这些产品会在学习场景和应用体验上卷差异化。作为非常匹配大模型能力且直面用户的场景,非常适合用来锻炼AI的队伍。It’s very easy to be different,but very difficult to be better . Jony Ive的这句话作为这个场景注脚。
教育领域更大的战场是什么,对应的产品是什么呢?
一、教育行业的元问题
教育产业的元问题是用户学习效果的问题,所有问题都是学习效果的衍生问题。
1.1)学习效果的交付无法绝对承诺
教育最终向用户交付的价值是「学习效果」,但是学习效果是无法统一衡量的。例如中学生的学习效果要体现在提分上,考证的用户则是要考试通过,业余兴趣例如学吉他的用户则真的要技能提升,而以培养一个想学副业技能的用户其实需要帮他在副业上赚到钱,而像产品和程序员培训课程的一部分用户的目标是找到相关专业的工作等。
因此从行业看,教育的学习效果本身是离散且无统一标准的。比如K12教培的付费用户(家长)要求给孩子提分:押题、应试技巧提升和学习能力提升都可以带来提分,由不同价值带来的产品取向会有不同侧重。
其次假设以能力提升作为学习效果的最大公约数,教育企业提供的产品是否就一定能怎么保障学习效果吗?
王慧文的一个分享中,把纯线上业务的企业划分到A面,包括腾讯、字节(现在不是了)等。A面的业务主要是在做信息层面的匹配(编辑、搜索、社交、算法),在信息的输出媒介(图/文/视频)和输入(编辑、UGC 和 信息质量)做文章。而把深入线下涉及到复杂的供应和履约的企业划分到B面,包括淘宝、滴滴、美团等。
借用老王的思路,教育需要提供好的内容(信息),还需要提供匹配目标用户水平的教学、督学和答疑服务(履约)。但做好这两个方面并不能保障学习效果完成教育价值的交付,因为学习效果(技能提升)的达成还需要学生花足够多的时间理解吸收并应用这些知识。因此教育还需要增加一个维度:C面-即用户自身注意力的长期投入。
duolingo用游戏化来解决C面的投入问题 |
斑马用动画+游戏化+助教来解决C面的问题 |
|
|
企业的产品是不是想保障学习效果,企业本身做不做B面和C面的事情,是判断一个企业是在做知识付费还是教育的关键。一个企业只做教育内容,也可以做图书出版,知识视频和刷题工具等,但商业天花板比较低。一些产品不做B面和C面的工作,又喜欢宣传能够解决或者暗示解决用户在生活中的真实问题,例如赚到钱、找到工作等,自然容易被诟病。这是知识付费和部分线上课程的核心问题。中国的在线教育在17年以后整个市场快速规模化,是好未来在此前跑通了线上双师模式。这个模式核心是教研做好内容,主讲老师为主做课程交付,同时主讲在课堂中卷互动&辅导老师在课后卷督学双管齐下来提升学生的时间投入。靠大量相对高素质人员做相对个性化服务保障了一些学习效果,也极大拉升了人力成本和管理成本。
学习效果是教育交付的主要价值,其对经营核心环节都有关键影响,是业务能够发展的基础
1.2)品类分散缺乏规模效应
教育是基础行业,中国当前市场化的部分,包括启蒙培训&成人培训&出版&教育工具&知识付费等。整体虽然是一个万亿市场,但由于用户的需求(学历、兴趣、考证、技能)本身存在巨大差异,当前市场上并不存在大统一的解决方案。教育的实际业务往往落到单个品类(考公、考研、思维启蒙、AI培训...)甚至品类的细分工具上(eg.英语-背单词、小学数学-作业拍照批改)。由于学习效果这个元需求的差异化,导致教育市场呈现为一个又一个无法泛化的垂直小市场,每个垂直市场的天花板往往不高。天花板不高自然无法聚集足够多的资源去形成规模效应,进入产出和投入的良性循环——这个行业本身又非常复杂,那就雪上加霜了。1.3)多个反规模效应因素推高了客单价
基础的学习效果由「内容+履约+学员长期注意力」三要素保障,前两个要素可以做非常深而最后一个要素不可控,导致教育产品之间的差异化非常难以被用户理解。消费者很容易产生买这个课程真的能达到学习效果吗的疑问:为了让消费者容易信任,在线教育企业短期则包装名师,长期则包装品牌,让消费者信任人或者品牌?当然这又分别有对应的问题和限制此处不赘述。这个卖五千的课程和x站的免费视频有什么差异?和x公司的200的课程有什么差异?
学习效果和课程的关系缺乏共识,用户为了感知学习效果,就需要花时间精力去体验课程感知学习效果,这是教育行业基本上用引流课或试听课转正价课的逻辑。绝大部分用户都要听课,享受服务后才能决策,引流课的获客和履约均有较高成本。这些成本最终会体现在正价课的价格上。由于教育参与者的自身能力、可投入资源、所在学习环境等产品提供方不可控的因素,需要个性化服务提升用户的学习时长和投入来保障学习效果。学员需要的个性化服务很难被标准策略解决,在线教育过去主要靠堆人解决。教学职能需要员工有较高的综合素质,这在招聘规模化和服务标准化上都是挑战,为了保障学习效果增加的个性化服务的高边际成本的会再一次推高成本。斑马AI课在双减前的助教老师团队以本科甚至重点大学毕业生为主,规模超过6万人。产品的非标会增加消费者的决策周期,而长决策周期又导致需要增加销售职能来跟进用户,销售环节会再次增加成本。教育市场特别是低复购的成人市场,大部分企业对销售没有管控能力也缺乏管控意愿,导致市场中充斥大量对效果过度承诺的课程。充斥虚假信息的市场环境会增加用户的筛选成本,推高用户的决策成本从而反过来也再一次提升了企业的获客成本。销售、老师、运营、产研等多种角色都出现在教育特别是在线教育业务中,不同职能的话语体系,流程习惯等会带来大量的协同成本。组织的协同成本虽然是隐性成本,但是往往也是一个业务规模化最大的成本和瓶颈。当多种成本相互叠加,教培的课程就便宜不下来,部分品类又刚需客观上导致了内卷,让有稳定作用的基础出现了冲击。
1.4)总结一下
- 教育行业垂直品类天花板低且品类间复用度差导致无法形成规模效应,行业整体的人才储备和技术投入不足
- 教育行业的学习效果多样。并且做好内容,做好重人力的履约外也有用户自身投入这个不完全可控因素影响学习效果
- 行业承载学习效果的产品具有复杂性难以被简单信任,且在销售、履约和服务等多个环节涉及到重人力等多个反规模效应的因素叠加推高了价格。
有一个简洁的公式来衡量一个业务要做足够好的前提「人才密度-组织协作成本>业务复杂度」。教育行业由于天花板不高难以聚集顶级人才,学习效果保障天然具有复杂度,且跑通的商业模式中包含多种人员职能,导致了组织协作成本和业务成本的剧增。从商业角度看,教育行业很长一段时间都算不上好行业。
大模型是一个全新的技术,并且从历史上能够看到教育行业随着技术发展而发展的事实。大模型是教育元问题的通解吗?
二、教育的草蛇灰线
教育本身是一个大词,例如存在科学技术突破,知识传承,帮助个体成为最好的自己等不同的教育理念。但是从推动产业发展,需要大量人可持续地参与在教育产业发展中。随着经济和生产力发展,教育的主要社会目的会随之变化,下表梳理了教育的发展方向。
|
|
|
|
|
|
|
|
|
|
|
|
|
大众教育,随着工业革命,各行业需要受过教育的员工,学成后为经济发展服务 |
|
|
|
在线课堂&互动课的大班小组课:内容标准化,相对个性化服务
|
|
中产在教育改变命运的意识驱使下内卷,为经济发展服务同时也为了获得经济发展的良好站位 |
|
|
|
|
国家的教育投入增长大多是在经济发展后,而非重视教育培养人才后才带来经济发展。教育产业应该关注社会如何变迁和发展。而到微观个体上,教育会让受教育者掌握知识,并基于掌握的知识预测未来并应对未来。2.1)农业社会到文艺复兴
农业社会大量的知识还不能非常高效转化为生产力,受教育的精英主要是服务于国家&宗教的治理,其内容主要是文哲史政,例如礼、乐、射、御、书、数的六艺。随着历史发展,国家等组织规模变大,需要更多受教育的精英参与国家和社会的治理中,教育从人带人的师徒制开始出现了专业的教育组织,教育产能从个人到多人主要技术:文艺复兴激发的大量知识和更早的各类经典随着古腾堡印刷术的发明加速了传播,民智的开启为工业革命打下了基础。2.2)工业革命到现代教育
工业革命的各类生产力工具跨越式发展带动了经济发展带来了标准化的现代教育雏形,而发展的原因是工厂需要大量受过教育的工人来操作和维护这些现代化机器。同时如此多的人参与到大规模生产中,需要人口基础素质较高以便被组织、管理来完成目标。由于标准化的现代教育是解决底线和规模化的问题,到了硕博等需要突破、传承的阶段,依然是师徒制这样可以个性化的教育模式。个性化是更好的传递和吸收知识的方式,但是其天然首先于提供个性化教育的老师的产能不足。主要技术:现代教育的标准 和 媒介升级带来的信息传播的延续性迭代:
- 标准化的教材:保障了教育机构可以最大规模和限度地扩大教育基数并且基于统一的目标保障教育效果:教学中采用最普适(内容需要适合中位数前后的人)的教材。
- 学校和老师:现代教育通过学校、班级这种实体聚集群体的竞争合作。将人固定在一个地方并且用大量的时间来保障学习的时间投入,并且采用测验考试等来检测效果。老师作为学习效果交付的核心中枢,需要承担知识讲授,维护课堂秩序,完成学生能力诊断评估并进行一定个性化指导的任务。实际上老师还承担了大量行政工作,此处不赘述。
- 媒介升级:广播、电视带来的比实体书籍更快更新更具体的知识传播
2.3)互联网时代的在线教育
大班直播课是在互联网在线教育中业务体量最大的模式。大班课是以老师为核心,教育科技企业提供「线上教室」+「教研系统」+「教务系统」辅助老师教学、教研和督学。整个教学实践围绕课堂展开,过程以教师为核心,其核心是将优秀老师对内容的理解通过直播方式释放产能,而将服务督学等任务下放给可以批量招聘培养的助教。这个过程,互联网技术提供的是工具和平台,彼时教学过程留存下来的视频数据并不足以支持深度的教育分析。在线教育快速发展的时候还出现了以斑马为代表的「AI课」。当时的AI课是极致标准化和数据化的产物,AI部分只涉及到语音纠音等弱AI应用。AI课将适合的学科的认知学习拆解变成一个个标准的小环节,为核心环节设计原子化的产品。例如英语学习扩展为认(视频、单词、自然拼读、绘本)-读(读词、读句)-写(手写)-练(听写、选、连线等)-报告-场景练习。AI课将原来由人(老师)完成的黑盒教学流程变成全程可数据追踪迭代的「互联网产品」,并且每个环节的生产会变成图片、视频、单词、音频等简单的物料生产。当然由于学科复杂度和学习效果问题,主要在启蒙阶段比较简单的学科成功了,启蒙阶段精美的动画能够吸引孩子注意力是非常重要的原因。
在线教育也出现了在学习上的「个性化、自适应学习」,实际上是基于知识图谱的自适应学习,含微课视频和练习题包的规划和推荐等。这块由于学习推荐并不是猜用户喜好,而是提升能力从而提分导致目标难以拟合。且线上学习产品很难拿到用户足够多的使用和特征数据等原因,其并没有像商品或内容推荐一样产生巨大的用户价值。仅有duolingo等少于语言学习产品在个性化推荐上有一定规模化的应用,然而duolingo的对外PR看,其自认为游戏化是更重要的因素。主要技术:在线教育主要是通过在线技术增加消费侧的分发规模,通过分工和专业化来将供给侧的内容和服务规模化,然后是通过更多过程的数字化来回收足够多的人和人、人和内容的交互数据来持续迭代内容的质量。2.4)基于历史的推导
AI时代的教育目标:教育的社会目的,在长期上决定了教育在宏观上投入的资源和规模。AI时代教育产业的基础判断是未来社会生产力下需要什么样的人才。历史也许会被少数天才的个人加速,然而普适地看教育是为了匹配社会进步而发展的,成为最好的自己是好的教育价值观但不会是产业的视角。教育每次产生更大的社会价值,都是随着更多更好的知识覆盖了更多人带来的,而个性化一直是效果更好的教育形式。只是在资源有限的情况下,要产生更大社会价值需要优先保障知识的覆盖规模而非个体获得的效果。效果需要更高的成本,而成本需要有人承担:教育培养出的人预期产出的平均价值要大于教育资源投入的价值,当然资源的投入来自于其父母或自身的经济收入也间接来自于国家或社会的教育基础建设。教育中,技术一直在扮演推动知识以更大规模分发(信息匹配的规模)以及以更好效果(信息质量)过程中,优化成本结构优化ROI的核心力量。当前在信息覆盖上已经达到边际了,更好的效果以及更好效果的规模化除了双师外,还没有非常大的突破。如果以AGI覆盖一切为前提讨论,大部分人类活动的价值都会被消解,教育仅仅是毛将焉附的一个附带问题。因此不进行所谓终局的判断,想要参与到影响终局的前提是有资格上牌桌。
- AI智能和生产力远超人类且能源不成为掣肘。社会绝大部分的价值由AI创造价值流通不以人类为中心,人存在的价值被消解了,教育的基础价值自然也就被消解了。人类如果还可以安全存在,教育就只剩下帮助个体对内寻求独特性了,这时候就应该讨论成为最好的自己了。不过即便发生,这个过程也会比Hinton和Ilya想象的会更久,毕竟人类历史有非常多的例子表示,站在顶端的不一定是最聪明的人。不过历史的聪明人的聪明不是断层式的,如果AI比最聪明的人还聪明上10倍,那也会有一个资源从人类到AI再到AI垄断的过程,这个过程不会那么短也不会那么和平。
- 不那么极端的方向是,AGI是一个超级工具,基于新的生产力组成新的社会组织形态。AI能力够强且有足够好的新交互解决大众使用的门槛,人跟人之间的差距会被AI工具迅速抹平:一个1分能力的普通人和一个3分能力的优秀的人和一个5分能力的天才之间不可逾越的差距因为10分的AI基座加持而变得平缓。所有人都基于工具产生巨大的价值(前提价值没被工具所有者所收割)。人类中心主义观点下,人类至少需要在组织中需要作为信任节点为AI的决策和行动按下暂停或方向键。教育本身帮助人更好应对未来的大部分功效和流程会被AGI工具本身可以创造的价值同化,对人的教育就变成培养某种企业家或海盗精神
三、大模型在教育中的理想与现实
3.1)理想中大模型是教育元问题的通解
大模型所具备的世界性知识在逻辑上包含了所有学科所需要的内容,因此理论上可以作为教育内容供给大一统的知识基座
大模型对语言展示出的理解事物,理解情感,推理能力使之下限都可作为教师的平替负责教学及辅导等履约交付工作
大模型通过拓展到几十亿token后就可以建立对学生深度的个性化理解,从而提供的定制策略配合形式系统或人类情感的模拟,从理性情感等多个角度帮助用户「立志」或基于「积极反馈」等短效长效手段让用户专注在必要的学习过程中
正向循环系统:大模型的效果理论会随着时间变好,用户不用担心货不对板;大模型的成本理论上会随着时间变低;大模型作为基座的教育业务的扩张不会增加大量人而被迫增加内部协作成本进入管理的反规模效应
3.2)现实下大模型本身是约束
当前看,引入大模型本身可以解决一系列问题,但是同样带来大量约束。但是大模型提供了解决底层复杂度的前景,而当前大模型带来复杂度和约束是可以解决的枝干。尽管我们还没有足够的认知和能力为GPT构建一套在教育场景下的通用的评价指标体系。但是在微积分被应用在实际生活中(包括战争)大概一百年之后,数学家们(主要是柯西)才差不多能清晰严谨地定义微积分作为一种数学理论到底是怎么回事。只要好用,人类是非常现实的,for better or for worse。
大模型核心应该用到理解,总结和推理能力
内容生成,幻觉(想象力过剩)的问题一直暴露
想象力是缺乏物理规律和现实世界的对齐,但是也是创新需要的「基因突变」
情绪理解强,但是缺乏具身载体不符合人的情感投射
四、2年内大模型切教育的机会
当我们讨论成功的时候,这个产品能够创造足够的ROI支持团队的运转和产品的持续迭代是基准。2C的语言产品和2B的AI销售和助教是这两个方向一两年内可以出成绩的方向。4.1)2C长板是语言,应用要在场景具象和学习投入上做厚
具象场景
不仅仅是一个BOT,而是发生在这个场景的所有事、物、人的集合。要以大模型为基座完成,上层做MultiAgent+workflow。
- 物:在剧情中应该出现的物,具象、可理解、可单向互动
- 人:在剧情中应该出现的人,具有符合的人设及独特的性格,可双向互动
- 应该有一个主线引导用户从去餐厅到找座位到点餐到埋单分支还可以有投诉等的剧情引导
- 而餐厅中足够多具象物品如座位,菜单,纸巾等物品,毕竟真实的对话场景中,我可以读餐厅菜单中菜,或者直接说this,而仅仅是一个服务员bot对话是做不到的
- 提出一个实际情境的问题,比如这个问题需要用到面积的概念来解决,比如土地征税、粮食产量等。这个过程重要的不是计算,而是「建构面积的概念」。
- 在这个实际问题过程中,能够形成一种不用计算,但依赖建构面积概念和一些操作手段就能解决问题的方法。为这个方法设计各种支架,以供学生遇到困难时使用。
- 引导学生分小组探究概念和解决问题的方法,在支架应用和解决问题过程中对学生进行核心素养的评价。
eg04.实际上这可以看做生成式学习的范式的系统化
- 生成式学习模型:Wittrock的生成式学习模型包括四个主要过程:(a)注意力,(b)动机,(c)知识和先前概念,以及(d)生成。这些过程涉及神经研究中的生成性大脑功能和知识获取研究中的认知功能。
- 大脑作为模型构建者:在生成式学习模型中,大脑被视为一个主动构建意义和行动计划的模型构建者,而不是简单地将输入转化为输出。大脑通过这些过程来理解经验和对感知到的现实做出反应。
- 教学的角色:在生成式学习框架内,教学被视为引导学习者使用他们的生成过程来构建意义和行动计划的过程。
学习投入
中期是「有用感知」,做法是场景建设,和实际可感知的效果案例输入有了对长中短期反馈的认知后,会比较自然地得出来这里应该是「虚拟人」的设计,这里并不是指数字人技术,而是可以托付感情建立信任的人。具象和学习投入,思路是创造有趣、具有挑战并且让用户认为获得物是有意义的有清晰规则、目标与量化反馈的形式系统。——最接近这个描述的形式系统是游戏。2C产品迭代的主线是:通过理解人性和社会环境来感受用户现状,通过产品帮助用户改变现状。前文在口语产品的判断上已经提到一些本文不再继续深入讨论。4.2) 2B做结构性替代而非提效
对外-工具:帮助企业获取外部资源是提效
企业用钱换资源的过程中提效:投放平台、数据平台
企业用资源换资源的过程中提效:建商品、建内容、建活动。更下层的原理是在渠道或线上生态中,企业不具备获取这些渠道资源的现成能力,因此引入这些系统,本质还是引入工具
对内-人效:项目成本、人力成本和组织协作成本
中国的2B的系统做不好,第一个原因是人力成本便宜。结合改革开放快速跟进到互联网市场的快速变化,头部企业基于业务特点做内效系统,而中国没有像西方工业化有那么长的时间来形成大量流程相对标准化的中间层企业——这些中间层企业追求效率的时候2B系统才有大的空间。
大部分2B系统在做的是提效从而降低人力成本和组织协作成本。组织协作成本往往是一个组织发展的瓶颈和最大的隐性成本【在本文撰写过程中,正好在知乎和微博分别刷到两个关注博主的内容】。
B系统引入难落地难是因为任何先进系统都会用一种新的方式打破原来的组织流程和利益结构。因此AI的2B想要尽量快速地切入且放大价值,要做到能够几乎完整替代整个环节——这种替代既可以节约人力成本,还可以降低组织协作成本。组织协作成本的降低是业务规模化中加速度的关键。大模型需要正确地提问和正确的提示,如果持续需要调用人脑资源去判断是否正确:不做完整的环节主导就无法成为最高效的策略工具。大模型是自由的工具,自由的工具需要减少协作和嵌入。大量的成本是协作和嵌入增加的,大模型由于不可控会增加协作的信任成本,因此需要一个环节闭环,在策略内完成闭环从而减少工具带来的成本。其中大模型是主导而非完整替代,近一两年内,大模型预期应该是替代70/80分位的销售,topsales变成大模型的mentor。2B系统迭代的主线是:理解组织和人性的诉求,将人或外部资源混沌的部分变成可解释、可复制和确定性的规则、功能和策略人在组织中产生价值,是在某种创造价值的流程中完成了某种或多种任务。因此我们的核心是在事的模型下拆解任务并基于领域模型评估任务完成的优劣。包括任务模型即事的模型,领域知识和技能模型。前文讲过销售和助教是在线教育发展中不可或缺的要素,但是他们客观导致了成本叠加上升。如果AI在这两个结构性的成本环节产生足够高的价值是能够颠覆原有模式和市场空间的——不仅仅是这两个成本结构的好转,而是产品变得更为标准和可理解的多成本优化。4.3 AI销售的模型分解
我们需要一个底层的理念:销售和产品、研发、设计、运营等工作都是创造价值的过程,我们需要理解其在整体价值创造环节中的组成:销售是在复杂非标的项目中,通过更为积极主动的方式获取用户注意力并给用户传达价值主张。其中,电销和社群销售可以在线上完成工作任务闭环。
|
|
|
|
|
|
|
|
|
|
识别真痛点,推理判断及影响决策的关键信息提炼的能力 |
|
|
|
|
销售态度评估:做没做——业务根据经验建立SOP执行情况和基础的产品行业知识掌握情况。系统目的是提升态度下限,降低销售态度造成的影响销售能力评估:好不好——传统是从结果如转化率或gmv来考核销售。业务会从沟通技巧,关单技巧,服务意识等角度看,具体策略还包括经营销售人设等个人品牌思路。AI看能评估也能提到这一部分4.4 AI助教的模型分解
|
|
|
|
基于服务和专业度形成的信任人设对用户产生有效的督学
|
|
|
|
基于学生的问题识别学生可能没有掌握好的知识并进行指导
|
大模型基于参数权重概率生成信息,接近人回忆原理且偏向第一系统,会有不符合客观事实的错误率,这种不符合事实的错误率在一些教学环节是不是都是不可接受的?当老师在非课程场景讲授他个人的观点的时候,老师一定是对的吗?SOLO水平层次和布卢姆教育目标分类,是教育领域观察、测量人类认知水平和学习成果的两种理论。在这张图中,它们被统一到一个系统中,并给出了浅层学习和深度学习的划分。李连华老师基于教育测评对ChatGPT进行了评测,得出如下图结论
概括的来看,ChatGPT有两件事非常擅长,而且表现较为稳定:
- 沟通与情商,尤其在你没有意识到它骗过你的时候。它的语义感知、情感感知和回复中的沟通能力,情商表现,初步来说堪称完美。在ChatGTP之前所有的聊天机器人,基本上我们聊天忍耐的极限是10分钟,但ChatGPT可以跟你聊很久。开玩笑说,配上生物体,可以带回家。
- 应用层次的问题回应,尤其是对方法实施或How类问题,往往能够给出一些基本可参考甚至有一些启发性的答案。你不一定直接使用它,但参考它,并基于你自己的领域知识做修订,肯定会有很大益处。而且,作为一个超级大脑,它不像人类有太多的专业盲区,那就意味着这是非常有价值的能力。
但它的能力缺陷也非常的明显。也可以概括为两个方面:
- 高阶思维表现的部分,ChatGPT不是没有能力——但取决于你的应用场景与核心要求,它的表现是不稳定的。当然,整体能力分数也不高——不高的原因,是因为是用教师的期待来体验它,如果是虚构类的编剧创作,可能它的分数还会高一些。但总的来讲,它的分析能力、评价能力是相对弱的,创造层面的「行为」要看场景,虽然它可以生成内容且极力讨好用户。
- 事实或概念的部分,ChatGPT的表现方差很大——有的时候是靠谱的,有的时候极度不靠谱。所以如果用户对信息的真实性有强依赖,而又没有快速简洁的验证方法的话,那么应用ChatGPT的答案会给你造成困扰。
我们可以看到:GPT 对于教育领域的各个方向或环节,基本上都具备支撑应用的能力。虽然每一个方向继续深入都存在一些挑战:有一些可以基于教育领域的私域数据来解决,有一些需要模型进一步的迭代,有一些则需要在应用层做许多的工作。但是这毕竟是曙光在望,而非空中楼阁。而GPT的能力还远远没有达到它的边界:数据域的变化,尤其是高质量的私域数据(如教学和学习的数据),将会大大赋能GPT的发展五、结语
本文简单分析了大模型代表的GenAI和教育结合关键约束和关键路径,内容偏向战略。但不少时候,战略是容易的,而战斗很难。战斗越往前发展,偶然和意外就越多;自我保持信念和勇气很难;在长时间和不确定性的市场中,一个团队要始终遵循既定的原则很难。大模型未来很可能是教育产业的通解。而近期的切入点包括具象场景、学习投入以及人的模型分解的方案又是泛化的。而更长期看,教育还是需要进行人的培养和社会需求的人才匹配工作,这一点上,外部知识和信息的输入可能是更重要的,内容平台或者知识社区可能是更好的角度。本文作者:jiangbo。如果你在AI领域工作、创业、研究或有交流的想法,欢迎加微信喝杯咖啡
参考信息
Sam Altman. Moore's Law for Everything:https://moores.samaltman.com/
李连华.ChatGPT与教育与未来[5]第一阶段小结:ChatGPT赋能教育https://mp.weixin.qq.com/s/nwiZzHVVAfXJuIxmh6sYxw
王慧文. 互联网有AB面,最惨烈战争发生在B2:https://www.163.com/dy/article/D5MK1KC30511DQUK.html
Wittrock. Generative Learning Processes of the Brain.https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=41895d66c72a5b25a0b308cc05a19a8a5b79b405
pansz的回答 - 知乎:https://www.zhihu.com/question/647902218/answer/3426112370
axb的自我修养的微博:https://weibo.com/1809500942/O6nlvg5RV
张斯成-即刻. https://okjk.co/JHcSFC
小宏-即刻. https://okjk.co/RgS9qO