AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


前沿技术解读:LearnLM——负责任的AI教育发展与开发
发布日期:2024-07-14 01:26:49 浏览次数: 1726


在《北京共识》的影响下,联合国教科文组织强调了人工智能的使用应以包容、公正和可持续的未来发展人类能力为目标:

核心文件解读:《教育与研究领域生成式人工智能指南》

在此理念下,人本人工智能是“近未来”人工智能发展的重要方向,是将人类的需求和价值观纳入人工智能技术的开发、应用和治理,构建服务于人类福祉和社会发展的人工智能体系。人本人工智能的特征主要包括以人为中心、关注用户体验、着眼于社会影响、倡导多学科合作、增强价值性和可解释性。

在未来,人(人类教师)机(机器智能)协同教学将成为教育界的新趋势。华东师范大学终身教授祝智庭在其研究《国家教育数字化战略行动研究》中提出了人机协同教学模式:

此外,中国的很多教育研究机构、科技公司,也在开发和研究教育类人工智能。如天津大学与科大讯飞联合开发的"数字教学助手",学而思开发的“九章大模型”,以及教育部门正在推动的人工智能示范应用场景建设等等。

他山之石,可以攻玉。本篇着重讲一下谷歌实验室即将在 9 月份发布的 LearnLM 及其相关教育类应用和实验。

  一、LearnLM 与教育创新

谷歌最近宣布推出学习大模型“LearnLM”,预计2024年9月正式发布。该模型基于谷歌大语言模型Gemini开发,是一款人工智能驱动的工具集,旨在彻底改变课堂管理和教学,可以激励积极学习、管理认知负荷、适应学习者、激发好奇心、深化元认知。

针对“LearnLM”,谷歌还发布了技术报告《面向教育生成式人工智能的负责任开发: 一种评估驱动的方法》,该报告介绍了谷歌改进教育生成式人工智能的方法,并强调了如何与人工智能和教育技术共同体合作,负责任地最大限度地发挥其积极影响和潜力。

虽然 LearnLM 正式版尚未推出,但也已经发布了很多测试版功能,如:

  • Google Search:调整AI概述格式,简化语言或分解内容

  • Android Circle to Search:解决数学和物理问题,即将支持更复杂问题

  • Gemini聊天:使用Gems作为个人专家,如学习教练提供逐步指导和练习活动

  • 在YouTube中:通过对话AI工具,在观看学术视频时提问、获取解释或进行测验

(以上大部分功能仅在北美开放,我在马来西亚,并不能获得访问权限)

也开发了专门的学习新工具:

  • Illuminate:将研究论文分解为简短的音频对话。Illuminate 是一项实验性技术,它利用人工智能根据你的学习偏好调整内容。讨论由人工智能语音生成,并以已发表的学术论文为基础。生成的内容仅供参考,有时可能具有攻击性或不准确,因此您应独立确认原始内容中的任何事实。人工智能语音是试验性的,有时可能会犯错误。您的反馈意见将有助于为大家改进技术。音频生成目前处于私人测试阶段。现阶段可申请加入等候名单。

  • Learn About:结合高质量内容、学习科学和聊天体验,引导用户逐步了解任何学科问题。以下为示例内容:

相信当这些应用和模型正式开放时会给全世界教育者带来新的震撼体验。


  二、谷歌技术研究报告


技术报告介绍了人工智能(AI)在教育领域的发展历程,以及生成性AI(gen AI)如何为教育提供个性化的学习体验。作者指出,尽管技术进步带来了希望,但要实现这些技术在教育领域的广泛应用,仍面临诸多挑战。


主要研究的问题是如何负责任地发展用于教育的生成性人工智能(Generative AI, gen AI),特别是通过评估驱动的方法来提升教育对话中AI助教的效能。作者在以下背景下提出这个问题:
  1. 教育不平等:全球面临提供公平且普及的高质量教育的重大挑战。尤其是在低至中等收入国家,许多儿童遭受学习贫困,而且COVID-19大流行进一步加剧了这些问题,对弱势背景的群体影响更大。

  2. AI技术发展:近年来,生成性AI技术取得了显著进展,为个性化教育提供了新的可能性,但同时也带来了如何确保其在教育中有效和负责任地使用的挑战。

  3. 教育技术(EdTech)的局限性:现有的教育技术系统并没有明确针对教育学进行优化,可能存在直接给出答案而不是引导学习的问题,这可能影响学生的学习过程和长期认知发展。

研究调查了多个群体,包括学习者、教育者、政策制定者和学术研究者。具体的样本量在文中没有明确给出总体数字,但提到了不同的研究阶段涉及的参与者人数,例如在工作坊中涉及的人数(60名大学生和34名STEM科目的高中教师)。

文中提到的实验研究主要包括参与式工作坊、半结构化访谈、“Wizard-of-Oz”原型设计会话和用户研究。这些实验是为了收集关于AI助教的用户体验和需求。

  • 参与式工作坊:涉及60名大学生和34名高中教师,通过小组讨论和设计活动来探索AI在教育中的应用。


  • 半结构化访谈:与教育者和学习者进行,以了解他们对AI助教的看法和需求。


  • Wizard-of-Oz原型设计会话:模拟AI助教与学习者之间的交互,研究团队成员扮演AI助教的角色。


  • 用户研究:在亚利桑那州立大学(ASU)的Study Hall项目中,将LearnLM-Tutor集成到课程中,收集学习者与AI助教交互的数据。


综合研究结论
  • LearnLM-Tutor作为AI助教,在经过针对性的微调后,在多个教育维度上显示出比Gemini 1.0(谷歌的通用级 AI)更好的性能,尤其是在促进学习者参与和提供有教育意义的反馈方面。
  • 自动评估方法证明了其在快速模型开发中的实用性,与人类评估结果呈现出强相关性,为AI助教的改进提供了有价值的反馈。
  • 人类评估揭示了AI助教在实际使用中的有效性,但也指出了在鼓励性言语方面可能需要进一步优化的地方。
  • 研究还表明,针对性的评估工具和方法对于提高AI助教的教育性能至关重要,尤其是在评估实践和家庭作业反馈方面。
  • 负责任的发展流程强调了在AI教育工具开发中考虑社会技术影响的重要性,并提供了一套全面的评估和缓解风险的框架。
  三、LearnLM现阶段研究的启示

在开发LearnLM过程中,研究团队借鉴了别的项目(ShiffBot)提出的开发原则:

  • 不要直接给出答案。相反,帮助学习者自己发现答案。然后帮助他们迈出下一步。

  • 以返回适当的可信资源为目标。

  • 为犯错提供安全空间。

  • 了解学生看到的内容:屏幕、代码和错误信息。

  • 机器人并不总是对的。我们应该从错误中吸取教训。

报告指出,在开发生成式人工智能教育模型应用时,还面临着一些挑战,例如:

——缺乏普遍的最佳教学实践。

同时指出,虽然学习和教学策略已经在许多学科中进行了研究,但定义(并随后量化)普遍的教学原则仍然是一个挑战。教育研究落后于许多现代科学,以至于在“21世纪初,教育研究终于进入了20世纪”。

研究团队因此提出了一套实用的7种不同的教育基准,涵盖定量、定性、自动和人工评估,具体包括单回合教学评估、学习者主观反馈、整体对话教学评估等。尽管技术进步带来了希望,但要实现这些技术在教育领域的广泛应用,仍面临诸多挑战。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询