人工智能时代,大学该如何重新思考考试制度
作者: aeks | 发布时间: 2025-12-03 03:01 | 更新时间: 2025-12-03 03:01
学科分类: 心理学 教育学 管理科学与工程 计算机科学与技术
自2022年底聊天机器人ChatGPT推出以来,教育工作者一直在探索如何利用人工智能促进学习,同时将其对教育成果和评估公平性的风险降至最低。如今,学生使用人工智能已成为常态。2025年2月的一项调查显示,超过1000名英国全日制本科生中,92%以某种形式使用人工智能,高于2024年的66%;88%的学生依赖生成式人工智能(一种能从海量数据集中生成文本、图像和代码的AI)辅助学业,而2024年这一比例为53%。
随着人工智能在阅读理解、计算机编程等基本任务上的表现持续超越人类,人们对其对学习和学术诚信的影响日益担忧。例如,鉴于AI现在能生成质量往往超过大多数学生作业的文章,传统论文和其他书面评估的价值越来越受到质疑。其他担忧还包括过度依赖聊天机器人导致浅层学习、自我反思机会减少以及学生能动性丧失,使学生成为技术的被动使用者而非主动学习者。
大学的应对措施是尝试使用工具检测学生对生成式AI的使用,但这些工具已被证明不可靠。这导致了一些短期解决方案,如“压力测试”书面评估、将其替换为口头考试、手写测试或反思性形式(档案袋和期刊),以及明确AI何时可以使用、何时不能使用的指导方针。尽管这些措施有帮助,但其效果有限。
相反,我们需要从根本上重新思考学习和评估。在此,我们重点介绍三种有前景的考试方法,这些方法对现有方式(如基于对话的评估)进行调整以适应AI时代。这些策略旨在促进真正的智力发展,同时确保评估能准确反映学生的理解和技能。
**采用其他类型的评估**
现代教育的基石之一是“写作即思考”。写作是一个非线性过程,需要真实参与、批判性思维和解决问题的能力,这些活动都能促进人类智力发展。但当AI辅助或生成学生文本时,我们几乎无法判断最终作品中有多少反映了学生自己的理解和批判性思维,这削弱了将写作作为学习证据的作用。
让学生和教师进行结构化对话是促进批判性思维的一种方式,例如苏格拉底式提问法,它能帮助学生梳理复杂思想、质疑假设并判断信息有效性。基于对话的评估——古希腊话语式方法的现代版本——已在中小学和大学使用数十年。比如田纳西州孟菲斯大学开发的AutoTutor,可教授牛顿物理学等科目并提高相关技能,它通过自然语言对话和计算技术(分析准确性、词汇选择、响应时间等)评估学生理解,但这类系统对话能力有限,主要依赖简单文本分析。
人工智能的整合可能改变这一局面。它能以更真实的方式维持开放式、情境敏感的对话,提出后续问题、提供个性化提示并实时适应学生知识水平,且提问范围比专门针对特定领域的传统对话评估系统更广。不过,挑战依然存在:AI需在鼓励学生主动探索与收集有效理解证据间取得平衡;可能存在沟通误解,AI或误解学生意图、提供错误信息;高度个性化和开放式的特点也使标准化变得困难,因此传统评估在大学招生等需大规模公平性的场景中仍有作用。
**进行持续评估**
针对学生广泛使用AI,许多应对措施虽试图维护学术诚信,但仍停留在高风险考试模式中。学生认为高风险考试压力大,可能表现不佳或作弊。在AI时代作弊可能更易的背景下,减少对高风险考试的需求成为关键挑战。
持续评估是有效的替代方案。它用一系列相互关联的评估取代期末考,以全面了解学生学习情况,这在医学教育中已很成熟,如临床轮转期间,导师通过观察学生的临床推理、团队合作和医患沟通能力,结合书面反思和同行评价,形成对学生能力的长期整体认识。但这种模式在其他学科中较少见,主要因增加了教育工作者的工作量。
人工智能系统的普及使持续评估更可行。学生与AI工具的对话可视为持续学习过程的一部分,多次低风险互动能逐渐构建学生进步的丰富图景。但当前的通用工具(如ChatGPT、Gemini、Copilot)并非为此设计,它们不会随时间分析学生回答以识别成长或持续误解。为真正支持持续评估,迫切需要以学习为导向的AI平台,能捕获学生表现的纵向数据、提供学习轨迹见解,并无缝集成到课程设计中。