来源:华东师大课程与教学研究所 作者: Ryan Baker 已有0人评论 2021/7/16 21:04:33 加入收藏
大家好,我是瑞安·贝克,我今天演讲的题目是“论自适应学习”。近年来,尤其是去年,关注学习者和学习的数据呈爆炸式增长,因为从幼儿园到企业培训都需要在线学习,可获得的数据显著增加。很多数据来自各式各样的交互式学习环境,来自一些交互式的游戏,比如像左上角这样的探索虚拟环境的游戏,或是通过绘制物体来学习物理概念并使它们动起来的游戏,像左下的物理游乐场,又比如中间的虚拟环境,以及右边的智能辅导系统和数学练习册。
我们从这些虚拟环境中收集学习者所有的行为数据。但是我们如何利用这些数据来帮助学生和支持教师呢?这个问题已经被讨论了近15年。
两个科学协会,国际教育数据挖掘协会和学习分析研究协会,都旨在探索“大数据”,加了双引号因为它比我们以往教育领域中的数据都要大,但不同于本次论坛其他演讲中提到的大数据。
这两个协会的共同目标是探索现有的关注学习者和学习的数据。这些方法有很多应用,包括预测一个学生会辍学还是成功并提供解释,自动检测学习、参与、情感或策略等内容,以实现更好的个性化,更好地为教师、学术顾问和其他利益相关者提供报告,以及基本的教育发现。
我将在接下来的演讲中讨论的自适应学习,需要做到以下三个要点。首先,确定学生的情况;第二,知道什么是重要的;第三,做出正确的干预。
我们先来谈谈如何确定学生的情况。这方面的研究相当成功,相关学术研究超越了在商业上的应用。
我们可以推测的第一类是“学习”。学生是否学会了当下的技能?几十年来,自适应学习的研究者一直致力于回答这一问题,并且已经研制了精妙的算法。学生在学习序列中处于什么位置?因此,我们不仅可以知道学生对正在学习的技能掌握了多少,而且我们能够考虑到更广泛的学习序列。如果学生遇到困难,我们可以为他们补充可能还不具备的前提知识。当学生学会了一项技能后,我们可以选择适合他们继续学习的技能。关于学习的第三种推断是了解学生是否在原地踏步,是否没能进步。有时在学习系统中,学生会遇到他们就是无法理解的内容,通过检测我们可以弄清楚发生了什么,并且尝试找到不同的学习资源来帮助他们继续学习。
我们可以做推测的另一类是“复杂学习”。学生是否学习了使用探究技能来解决复杂问题?在圣佩德罗斯的研究中,他们能够制作一个模型,来判断学生是否能够使用某些探究策略。这个模型适用于全新的科学领域。这个系统现在已经可以在中国大规模使用了。学生是否在物理和计算思维等复杂领域生成了丰富的概念理解?
强有力的学习。理想情况下,我们不只是想知道一个学生知道什么,我们还想知道他们是否能长时间记住它。学生会记得他们学到的知识吗?他们是否为将来的学习做好了准备?他们准备好学习下一项内容了吗?我们的一些研究已经能够证明这一点。
元认知。我们可以推断出学生对自己思维的看法。学生对自己的知识有多自信?他们是否运用了适当的策略并在需要时寻求帮助?面对挑战,他们是否会坚持不懈?
游离行为,比如钻空子。我们可以检测到学生成功完成了学习任务但没有真正地学习,这一点我稍后会讨论,它其实是更糟糕的学习。有几篇论文表明,我们不仅可以检测到这类行为,而且帕克特的最新研究还开发了一种用于全新学习软件的钻空子检测程序。又比如粗心,另一种游离行为。当一个学生掌握了所有技能,但出于种种原因,无法展示这些技能。尽管他们知道这些技能,但是他们还是会出错。
感情,即情境中的情绪,如无聊、沮丧、困惑、专注、好奇等。
现在我们仅从学生与学习系统的交互中就可以检测出这些变量。虽然在可行的情况下使用传感器可以提高模型的质量,但传感器并非在所有学习情境中都可行。
这些模型是如何研发的?我们首先通过监督学习范式(通常是分类)获得一些基本事实的指标,例如关于学生退学、失败或表现的数据,学生学习效果或记忆力的测试结果,学生情绪或态度的自我报告,或者是研究人员对策略或行为的记录数据的注释。最后一种方法我的实验室以前经常使用,但现在用得少了,那就是课堂观察或实地观察学生的参与度、策略使用和情感等要素。
获得基本事实和训练标签后,下一步是使用数据挖掘来查找可能与基本事实同时出现的运行数据指标。通常情况下,研究人员提取与目标要素相关的交互特征,然后使用Python或R等软件,将其输入到标准的数据挖掘机器学习算法中。深度学习和自动编码在人工智能的许多领域都有着难以置信的强大功能。目前还不清楚它们是否更适合现在的应用。部分早期研究给出了肯定的回答,但也有后续的研究表明这些模型可能不稳定。姜阳发现其实没什么区别。这可能是因为按照现代标准,可以在这个空间收集的数据集通常很小。
模型开发成功后,需要测试模型的可推广性。越来越多的证据表明,模型不能跨群体迁移,并且存在算法偏差。我和霍恩最近发表了一篇相关的述评,各位可以在谷歌学术网站上找到。
一旦你对学生的情况有所了解,那么下一步就是知道什么是重要的。
举个例子,请设想学生们正在上一门高阶的慕课,这门课关于数据科学和教学,上课的学生有研究生、大学教师、学校管理者和教师、信息技术工作者和数据科学家等等。学生在课程中的互动表现,可以预测该生最终是否会在该领域投稿发表。王老师在几年前做了这个研究,事实上,她发现,与其他领域的研究相反,如果你在网课的论坛上发很多帖子,你更有可能在这门课上取得好成绩。王老师通过她的研究验证了这一结果,这表明如果你在论坛上发布更多的帖子,你就更有可能完成课程。但事实证明,如果我们去关注学生如何运用这些技能,那些在论坛里潜水的学生,那些读了很多帖子,但不怎么发帖的学生,实际上比论坛发帖者更有可能投稿发表。这就是为什么我们需要研究什么行为是重要的,因为它通常是违背直觉的。
另一个例子,辅助纵向数据集显示,十一、二岁的学生在初中数学中的学习和游离行为,不仅可以预测年终考试表现,还可以预测几年后的大学录取结果,大学专业,甚至大学毕业后的第一份工作。研究显示,如果你在初中数学学习中钻空子或者粗心大意,那么11年后你离开大学,就不太可能从事涉及科学或数学的工作。
你了解了学生的情况,也知道了什么是重要的,接下来该怎么做?
当我们了解到一个学生很无聊,或者在钻空子,或者在经历浅层学习,我们该怎么做?潜在的干预空间很大。比如由动画代理提供的自动干预,不管是左边的史蒂夫,他指着显示器上的东西来帮助学生集中注意力,还是中间的数学老师斯普林,她模仿学生的情感,试图与学生产生共鸣,并让他们保持积极的情绪。或者右边的助教斯古特,当学生钻空子时,他会跳出来,为学生提供替代材料来弥补他们错过的知识。
第二类是隐形的干预,微妙地改变学习者的体验,例如掌握学习法,在学生证明他们掌握技能时继续推进他们的学习;如果学生感到困惑,调整难度或提供脚手架,或许下一个问题在不知不觉中会容易一些,或者提供额外的帮助。
另一大类干预措施是向教师、课程设计者或学习者自己提供报告。这些措施在帮助教师选取教学法来找出学生所面临的困难并帮助他们的方面尤为突出,比如第二天主动补救或者讨论家庭作业中的常见错误。
第四类不是真正意义上的干预,但在这些模型中仍然非常重要,就是分析哪些内容表现良好,哪些表现不好。使用自动化模型来确定哪些内容学习者学得慢,或者学生错误中有无法解释的模式。例如,贝克、高达和萨拉明确定了哪些教学视频提高了学生的表现,然后将结果反馈给课程内容团队。
这里有巨大的潜在干预空间,我们可以做很多事情。它仍然是开放的,对于我的实验室和许多其他实验室来说,这是一个正在进行大量研究的领域。这些方法有很大的潜力来改变教育。当下的细粒度的行为可以预测日后的重大结果。初中数学的参与度或游离度可以预测大学里上课的出勤率、大学专业和大学毕业后的第一份工作。
大观念。多亏了更大的数据,注意我说的是更大的,多亏了有关学生学习的大量数据和现代学习分析方法,我们不仅可以实时推断学生的情况,还可以预测长期结果。
最终目标是跟踪学生当下的参与度和学习情况,从而预测长期影响,在必要的时候进行干预,帮助学生重新参与并支持他们的学习,帮助创建一个对个别学习者的需求更敏感的教育系统和个性化教育平台。未来充满挑战,但也伴随机遇。
感谢各位的关注。如果想了解更多关于我今天分享的内容,请随时在线搜索我们实验室的出版物。我们还会在推特和脸书上发布所有最新的出版物。最后,我们有教育方面的大数据,edX平台的慕课。如果您对此感兴趣,请联系我们。所有这些慕课的视频都可以在宾夕法尼亚大学的网页上找到。
非常感谢您的时间和关注,希望您能有所收获。如果您有任何问题,请随时通过电子邮件联系我们。祝愿大家度过美好的一天!
(Ryan Baker 美国宾夕法尼亚大学教育学院终身副教授,他于卡内基梅隆大学获得人机交互方向的博士学位,目前担任宾夕法尼亚大学学习数据分析研究中心主任。他的研究方向包括学生如何借助教育游戏、智能导师等教育软件提升学习能力。Baker博士是国际教育数据挖掘协会的创始主席,他创新性地研发了从学生和教育软件之间的交互中挖掘数据的方法,并利用这些信息来了解学生对教育软件产生了什么反应,这些反应又如何影响学生的学习。)
中国创新教育网 版权所有:站内信息除转载外均为中国创新教育网版权所有,转载或摘录须获得本网站许可。
地 址:潍坊市奎文区东风大街8081号 鲁ICP备19030718号 鲁公网安备 37070502000299号