从过去中学习
教育的变革已成为常态。全球范围内,国家教育体系的改革屡见不鲜,典型的例子包括从文法与职业学校的双轨制转向综合学校模式,或从教育权力的分散管理转向课程与评估的集中控制,反之亦然。教育体系的变革通常伴随着评估方法的发展。近年来的例子包括从课程结束考试转向模块化评估,或采用超越纸笔测试的评估方法,更深入地依赖教师判断,采用多种方式收集学习证据。
技术在教育改革中日益发挥重要作用。从计算机进入学校并开发相关课程以提高其使用意识和能力,到互联网的引入及其提供的获取知识和交流的机会。课程从建立意识和知识转向促进应用和可转移技能,并从独立学科转向跨学科整合。然而,信息与通信技术(ICT)以及计算机科学的评估仍采用传统方式。
即使在学校中设备、应用程序和新技术(如虚拟现实)的广泛使用下,学校教育、教学和评估的过程并未发生显著变化。学生以更具吸引力的方式获取知识,并以更生动的方式表达他们的所知所想,但学习和教学的过程并未如预期那样发生转变。在线教育虽然出现,但仍属边缘现象,教师的核心地位依旧稳固,全球数百万学生将在未来几周和几个月内参加纸笔考试。这与技术在生活和工作其他领域的变革形成鲜明对比。
从上述观点中我们能学到什么呢?
- 国家教育体系的改革复杂且缓慢,即使涉及技术方面也是如此。
- 技术拓宽了学生获取和展示知识以及交流的方式。
- 尽管引入了设备、互联网和各种应用程序,学校的教学和评估过程并未发生根本性转变。
- 正式的评估实践保持不变,或在使用技术时,仍侧重于评估规定的知识及其在已知情境中的应用。
总之,教育体系在不断演变和改革。技术的引入为教育增添了新的维度,但教学、学习和评估的许多过程仍与以往方法相似。其原因在于,迄今为止,技术主要集中在增强知识的获取和交流。学习是复杂的,学生如何接触知识只是过程的一部分。此外,技术在评估中的作用主要体现在提高传统课程领域知识评估的效率。
全球社会和经济条件是教育改革的关键驱动力,许多利益相关者对此表示强烈支持。但技术如何更深入地融入新的教育格局,其对评估有何影响?

展望未来
近期技术的发展正在彻底改变我们生活和工作的方式。但这种变化对学校和教育过程的影响是否同样深远呢?很可能是的。有观点认为,这种影响将由我们如何利用技术的愿望所定义。
如今,技术能够以之前不可能的方式运作。它不仅可以提供知识的获取途径,还能生成知识。信息可以被分析、综合,甚至评估,进而生成广泛准确的产品供我们使用。x本文认为,这一进步正是技术如何深入到学校和学习核心的方式。技术的学习、预测和“智能”操作能力如今已经在多个领域广泛应用,并且在教育领域中逐渐崭露头角,人工智能(AI)已经不可忽视。学校必须拥抱这一技术,使学生意识到它的可能性和风险,并展示如何有效地利用其力量。然而,仍然需要更系统的教师培训和适当发展的课程。
生成式人工智能已经被教育工作者用于有效准备教学材料。例如,可以生成符合不同需求、问题类型或为支持学生阅读能力而设计的评估题目。然而,现实情况是,虽然效率有所提高,但这并未深刻改变我们的教学方式,特别是评估方法。
技术与评估
评估在学习中的作用已经被深入研究。本文将使用一个简单的评估定义:收集关于学习者所知和能做的事情的证据。我们需要认识到,学习者大脑中的心理构建和通过评估活动收集的证据之间存在差距,评估活动所采样的证据往往并不完全准确。因此,所有评估实践都有可能出错。但高效的教育工作者能够设计和实施评估活动,减少证据中的错误,并在做出关于学生所知和能做的判断时考虑到这些错误。
评估的复杂性意味着,斯威茨基(Swiecki)等人(2024年)描述的标准评估范式(SAP)往往会导致教师生成以下类型的评估任务:
- 生产起来繁琐
- 不恰当地反映目的
- 缺乏有效性和可靠性
- 狭隘且不反映进展
- 缺乏个性化
Swiecki等人(2024年)和其他人认为,这为AI在评估中的应用提供了机会。在对AI在评估中应用的回顾中指出:
- AI应用于简单的评估方法(如多项选择题)已经广泛使用,但深入分析显示,需要大量投资才能重现教师生成的基本水平的评估,且现有的AI模型并不总是展现出高可靠性。
- AI在改善同行评估的可靠性方面的应用已有不同程度的成功报道。
- AI在对扩展性写作任务的写作分析中展示了一定的效果。
- 电子评估平台和游戏化应用在评估知识及其应用方面提供了日益完善的证据。当采用多模态的数据收集方法时,AI衍生的方法能够提供学习进展的显著证据。
- 计算机自适应测试(CAT)可以提供更高的精度。
- 数字模拟任务能够为学习者提供在已知和陌生情境中应用学习的机会,并且效果已被报告。
最终,AI和技术在评估中的一个好处是,它允许学习者以多模态的方式外化知识,从而增强评估的效果。
上述列表为AI及其应用在评估中的初步使用方式提供了介绍。然而,AI仍未成为评估的强大推动力。研究人员在这一领域列出了在使用AI评估模型时需要考虑的几个方面:(i)现有应用需要教师的专业知识,以批判性地参考AI生成的数据;(ii)当前AI方法尚未有效链接到评估的教学法和形成性利用;(iii)使用AI的评估实践聚焦于所学的内容;(iv)随着AI评估系统的改进,持续对学生进行评估的可能性引发了对控制和合规性的担忧。梅马里安 (Mermian)和多莱克 (Doleck)(2024年)认为,AI系统的一个限制是它并未始终与学习理论适当对接。因此,AI驱动的评估主要帮助教师处理(i)对知识回忆的反应解释;(ii)帮助翻译;(iii)生成不同形式的文本展示;(iv)数据的分析和总结。
上述内容提出了一个与AI系统对学生所知及能做的评估较为狭窄相关的要点。梅马里安 (Mermian)和多莱克 (Doleck)(2024年)在他们的工作中支持这一观点,讨论了AI与学习评估(AfL)的关系。AfL的定义是:教师确立特定学习目标的成功学习标准,收集学生的表现证据并根据标准进行评估,然后利用这些证据形成性地提供反馈,以帮助教师和学生推进到达学习目标的过程。有大量证据表明,AfL在支持学习方面极为有效(威利姆(Wiliam)等,2024年)。
对AI在AfL中的使用的研究文献回顾表明,目前相对较少有研究通过量化证据证明其影响(仅有一篇文章),大部分研究集中在学生感知的定性分析上(梅马里安和多莱克,2024年)。大多数AI活动聚焦于学习评估。迪塞尔博(DiCerbo)(2020年)指出,当AfL应用于多样化学生群体时,教师的教学法复杂且微妙,而AI尚未能够在通知课堂教学、考虑学习者的起点和进展以及现实应用中展示相同的操作水平。然而,AfL的成功影响的差异性(威利姆,2018年)为AI在有效实施评估以促进学习方面做出贡献提供了机会。梅马里安和多莱克(2024年)提出的建议为这一问题指明了一个重要的前进方向。

技术与评估的可能性
教育改革的趋势与本文第一部分提出的有所不同。教育的期望成果通过不同的社会和经济范式来审视,因此,学生福祉、思维方式、可转移技能和环境等概念的定义更加雄心勃勃,这些在过去通常处于边缘地位。教育的成果应是培养能够管理自身福祉、具备价值观和品格、具备有效公民所需的技能和知识、具备有效的人际沟通和语言能力、具备数字素养并对社会有责任感的年轻人。
实现这些教育改革目标将需要对课程结构、教学方法,甚至是评估方法进行根本性的改变。关于后者,这不仅涉及我们如何评估,还涉及我们评估的内容。我们需要有效地评估以下方面:
- 学生的福祉
- 知识应用和思维方式,例如批判性思维或创造力
- 自我调节和学习能力
- 沟通、语言和人际技能
- 数字素养
这些学习特点不太可能通过传统的纸笔测试来评估。管理自我调节、创造力或有效人际交往技能的熟练程度将依赖于替代性证据来源,可能是通过观察学生的行为、行动和决策过程。这正是技术的应用领域——技术不仅可以作为有效的知识提供者来辅助学习,还可以作为生成学习和发展数据的工具。机器学习使得这些目标成为可能。现有的框架用于评估学生的福祉、参与度或任务中的认知挑战,通过技术的应用,这些框架可以用来收集数据,并即时向教师反馈学生的感受、学习承诺以及任务是否过于具有挑战性。它可以生成超越传统评估实践的标准化学习特征评估。
开篇部分指出了全球社会和经济条件作为教育改革的驱动力,并提出如何让技术更深刻地融入教育新格局?上述提出的机会,本文认为,提供了实现这一目标的前进道路。

下一步
尽管目前教育系统尚未准备好实施前述可能性,但如果有需求,它们将逐步实现。仅仅依靠技术并不能决定是否实现这些目标。以下是提出的几个发展领域,旨在推动教育改革的落实:
- 教师培训
虽然最初需要对教师进行新兴技术的技能提升,但更大的挑战在于重构初始教师教育和持续专业发展,专注于教授和评估学生福祉、创意思维或批判性思维的知识应用、发展学习和自我调节技能、促进人际沟通技能,并整合数字素养。这需要在可识别的课程领域中并通过集成项目来实施。
- 课程
教育系统需要大幅修改课程,以便明确教授学生福祉、知识应用和思维方式,例如批判性或创造性思维、自我调节和学习能力、沟通、语言和人际技能,以及数字素养。这些改革需要配套的指导和培训。
- 研究
上述内容表明,在评估中应用人工智能(AI)仍需进一步完善,但为教育的进步提供了丰富的机会。通过与学校合作开展的实证研究的整合,可能成为加速改革实施的有效途径。
- 可信赖的AI评估方法
只有在解决上述问题之后,可信赖的AI评估方法才能显示其有效性和可靠性,从而被信任为提供学习证据的有效方式,与现有的标准评估范式(SAP)并行使用。
然而,教育的预期变化是由社会和经济需求推动的,这些需求不能等待国家系统中报告的教育改革不一致性。或许前进的道路是通过高等教育、私立国际学校和国家教育系统之间的合作。国际学校比国家系统在教育发展方面更具灵活性和活力,此外,它们通常拥有更多资源和机会来实施新技术。通过与国际学校的经验交流,国家系统可以提升教育改革的进程。
AISL Mall汇聚了值得信赖的供应商与前瞻性资源,助力学校、教育工作者与学习者拥抱变革。
参考文献与进一步阅读
- DiCerbo, K. (2020) Assessment for learning with diverse learners in a digital world. Educational Management: Issues and Practice, 29(3), 90-93.
- Laevers, F & Declercq, B (2018). How well‐being and involvement fit into the commitment to children’s rights. European Journal of Education, 53, 325–335.
- Memarian, B and Doleck, T. (2024) A review of assessment for learning with artificial intelligence. Computers in Human Behaviour: Artificial Humans (2).
- Swiecki, Z. et al., (2022) Assessment in the age of artificial intelligence. Computers in Human Behaviour: Artificial Humans (3).
- Unseco (2024), AI and Education: Guidance for Policy Makers.
- Wiliam, D. (2018) Assessment for Learning: Meeting the challenge of implementation.
- Wiliam, D., Lee, C., Harrison, C. & Black, P. (2004) Teachers developing assessment for learning: Impact on student achievement. Assessment in Education: Principles, Policy & Practice, 11(1), 4-65.