我要投稿

前沿技术解读：LearnLM——负责任的AI教育发展与开发

发布日期：2024-07-14 01:26:49 浏览次数： 2517 作者：小鱼儿的学习笔记

在《北京共识》的影响下，联合国教科文组织强调了人工智能的使用应以包容、公正和可持续的未来发展人类能力为目标：

核心文件解读：《教育与研究领域生成式人工智能指南》

在此理念下，人本人工智能是“近未来”人工智能发展的重要方向，是将人类的需求和价值观纳入人工智能技术的开发、应用和治理，构建服务于人类福祉和社会发展的人工智能体系。人本人工智能的特征主要包括以人为中心、关注用户体验、着眼于社会影响、倡导多学科合作、增强价值性和可解释性。

在未来，人（人类教师）机（机器智能）协同教学将成为教育界的新趋势。华东师范大学终身教授祝智庭在其研究《国家教育数字化战略行动研究》中提出了人机协同教学模式：

此外，中国的很多教育研究机构、科技公司，也在开发和研究教育类人工智能。比如天津大学与科大讯飞联合开发的"数字教学助手"，学而思开发的“九章大模型”，以及教育部门正在推动的人工智能示范应用场景建设等等。

他山之石，可以攻玉。本篇着重讲一下谷歌实验室即将在 9 月份发布的 LearnLM 及其相关教育类应用和实验。

一、LearnLM 与教育创新

谷歌最近宣布推出学习大模型“LearnLM”，预计2024年9月正式发布。该模型基于谷歌大语言模型Gemini开发，是一款人工智能驱动的工具集，旨在彻底改变课堂管理和教学，可以激励积极学习、管理认知负荷、适应学习者、激发好奇心、深化元认知。

针对“LearnLM”，谷歌还发布了技术报告《面向教育生成式人工智能的负责任开发: 一种评估驱动的方法》，该报告介绍了谷歌改进教育生成式人工智能的方法，并强调了如何与人工智能和教育技术共同体合作，负责任地最大限度地发挥其积极影响和潜力。

Illuminate：将研究论文分解为简短的音频对话。Illuminate 是一项实验性技术，它利用人工智能根据你的学习偏好调整内容。讨论由人工智能语音生成，并以已发表的学术论文为基础。生成的内容仅供参考，有时可能具有攻击性或不准确，因此您应独立确认原始内容中的任何事实。人工智能语音是试验性的，有时可能会犯错误。您的反馈意见将有助于为大家改进技术。音频生成目前处于私人测试阶段。现阶段可申请加入等候名单。

相信当这些应用和模型正式开放时会给全世界教育者带来新的震撼体验。

二、谷歌技术研究报告

技术报告介绍了人工智能（AI）在教育领域的发展历程，以及生成性AI（gen AI）如何为教育提供个性化的学习体验。作者指出，尽管技术进步带来了希望，但要实现这些技术在教育领域的广泛应用，仍面临诸多挑战。

主要研究的问题是如何负责任地发展用于教育的生成性人工智能（Generative AI, gen AI），特别是通过评估驱动的方法来提升教育对话中AI助教的效能。作者在以下背景下提出这个问题：

教育不平等：全球面临提供公平且普及的高质量教育的重大挑战。尤其是在低至中等收入国家，许多儿童遭受学习贫困，而且COVID-19大流行进一步加剧了这些问题，对弱势背景的群体影响更大。
AI技术发展：近年来，生成性AI技术取得了显著进展，为个性化教育提供了新的可能性，但同时也带来了如何确保其在教育中有效和负责任地使用的挑战。
教育技术（EdTech）的局限性：现有的教育技术系统并没有明确针对教育学进行优化，可能存在直接给出答案而不是引导学习的问题，这可能影响学生的学习过程和长期认知发展。

研究调查了多个群体，包括学习者、教育者、政策制定者和学术研究者。具体的样本量在文中没有明确给出总体数字，但提到了不同的研究阶段涉及的参与者人数，例如在工作坊中涉及的人数（60名大学生和34名STEM科目的高中教师）。

文中提到的实验研究主要包括参与式工作坊、半结构化访谈、“Wizard-of-Oz”原型设计会话和用户研究。这些实验是为了收集关于AI助教的用户体验和需求。

综合研究结论：

LearnLM-Tutor作为AI助教，在经过针对性的微调后，在多个教育维度上显示出比Gemini 1.0（谷歌的通用级 AI）更好的性能，尤其是在促进学习者参与和提供有教育意义的反馈方面。
自动评估方法证明了其在快速模型开发中的实用性，与人类评估结果呈现出强相关性，为AI助教的改进提供了有价值的反馈。
人类评估揭示了AI助教在实际使用中的有效性，但也指出了在鼓励性言语方面可能需要进一步优化的地方。
研究还表明，针对性的评估工具和方法对于提高AI助教的教育性能至关重要，尤其是在评估实践和家庭作业反馈方面。
负责任的发展流程强调了在AI教育工具开发中考虑社会技术影响的重要性，并提供了一套全面的评估和缓解风险的框架。

三、LearnLM现阶段研究的启示

在开发LearnLM过程中，研究团队借鉴了别的项目（ShiffBot）提出的开发原则：