AI教育革命:教师如何重塑教学与评估的未来

2

在人工智能技术迅猛发展的今天,教育领域正经历着前所未有的变革。当公众讨论AI在教育中的应用时,焦点往往集中在学生如何利用大型语言模型辅助学习和写作。然而,一个常被忽视的事实是——教育工作者同样是AI技术的重要使用者。根据最近的盖洛普调查,教师报告称AI工具每周为他们平均节省5.9小时的工作时间。颇具讽刺意味的是,在通常的讨论中,学生开始对教授在课堂中使用AI表达担忧。

本文将深入探讨教育工作者如何利用AI技术(特别是Claude)改变传统教学模式,分析他们在课程开发、学术研究和学生评估等方面的创新应用,并探讨AI如何促使教育者重新思考教学内容与方法。

教育工作者AI应用的多元场景

教育工作者对AI的应用远超课堂范畴,从开发课程材料、撰写资助提案,到学术指导和处理招生、财务规划等行政事务,AI已成为教育生态系统中的重要组成部分。

与仅使用聊天机器人不同,许多教育工作者正在利用AI构建自己的定制工具。例如,通过Claude的Artifacts功能,教师们创建了交互式教育材料,如化学模拟、自动评分标准和数据可视化仪表板。这些工具不仅提高了教学效率,还创造了更加个性化和互动的学习体验。

AI教育应用

教育工作者倾向于将AI应用于繁琐任务的自动化,同时保持对其他方面的参与。那些需要大量上下文、创造力或直接与学生互动的任务——如设计课程、指导学生和撰写资助提案——是教育工作者更可能将AI作为增强工具使用的领域。相比之下,常规的行政工作,如财务管理和记录保存,则更倾向于完全自动化。

值得注意的是,关于AI辅助评分存在明显分歧。在我们的Claude.ai数据分析中,教师使用AI进行评分和评估的频率低于其他用途,但在使用时,48.9%的情况下他们采用了高度自动化的方式(AI直接执行任务)。这与教育工作者对自动化评估任务的担忧形成对比,同时受访教师也将评分视为AI效果最差的领域。

研究方法与数据来源

本研究采用了Anthropic的自动化分析研究工具,该工具能够揭示Claude使用的广泛模式,同时保护用户隐私。研究分析了2025年5月至6月期间,全球约74,000次匿名对话,这些对话来自使用Claude.ai的教育工作者。此外,研究团队还与东北大学合作,直接了解教职员工在大学内部如何使用AI。

由于目前平台不收集用户自报的职业数据,研究高等教育专业人士使用Claude.ai面临独特挑战。与经常明确提及课程作业或作业的学生不同,教育工作者的AI互动跨越教学、研究、管理和个人学习多个领域,使其更难识别和分类。

研究团队使用隐私保护工具分析了与高等教育电子邮件地址关联的Claude.ai免费版和专业版账户对话,然后自动筛选出与教育工作者特定任务相关的对话——如创建教学大纲、评分作业或开发课程材料。这种筛选方法产生了约74,000次对话,分析应被视为探索教育工作者如何使用AI处理专业任务,而非全面的教育工作者AI使用情况。

此外,研究团队将每次对话与美国劳工部O*NET职业信息数据库中全面的教育工作者任务列表中最合适的任务进行匹配。研究将教育工作者任务定义为与"高等教育"教学或行政相关联的任务。

教育工作者最常见的AI应用

根据Claude.ai分析和与东北大学的定性研究,AI最突出的用途是课程开发。Claude.ai分析还显示,学术研究和评估学生表现是第二和第三最常见的用途。

教育工作者AI应用统计

基于74,000次Claude.ai对话的教育工作者前三名AI应用:开发课程(分析中对话的57%)、进行学术研究(13%)和评估学生表现(7%)。图中还显示了教职员工使用AI完成这些任务的增强/自动化频谱。

在调查中,东北大学教师报告称另一个常见案例是使用AI进行自身学习(平均占他们AI使用时间的29%)。然而,由于筛选机制和在这些学习实例中区分学生和教育工作者使用情况的难度,这一点在我们的Claude.ai分析中未进行研究。

我们在Claude.ai数据中发现的一些其他特别有趣的用途包括:

  • 为教育模拟创建模拟法律场景;
  • 开发职业教育和劳动力培训内容;
  • 为学术或专业申请起草推荐信;
  • 创建会议议程和相关行政文件。

教育工作者使用AI的动机

与东北大学教育工作者的定性研究揭示了教育工作者经常倾向于这些常见AI用途的原因:

  1. 繁琐任务的自动化("它处理繁琐的任务";帮助"筹款中机械的部分");
  2. 协作思维伙伴("AI能找到有效的方法向学生解释我自己没想到的概念");
  3. 学生的个性化学习体验("AI对于给学生和我提供个性化、互动的学习体验很有用,这超出了单一教师所能提供的范围")。

教育工作者如何构建AI定制工具

最鼓舞人心的发现之一是教育工作者如何利用Claude的Artifacts功能创建交互式教育材料。他们不仅仅是进行对话,而是在构建完整的、功能性资源,在某些情况下可以立即在课堂中部署。

正如一位接受调查的东北大学教授所言:"以前 prohibitively expensive(时间)的事情现在变得可能。定制模拟、插图、交互式实验。哇。对学生来说更具参与感。"

教育工作者创建的关键工具

交互式教育游戏:包括基于网络的逃脱室、平台游戏和模拟,通过各种主题和级别使用游戏化教授概念。

评估和评估工具:带有自动反馈系统的HTML测验、用于分析学生表现的CSV数据处理器和全面的评分标准。

数据可视化:交互式显示,帮助学生可视化从历史时间线到科学概念的一切。

学科特定学习工具:专业资源,如化学化学计量游戏、带有自动反馈的遗传学测验和计算物理模型。

学术日历和调度工具:可自动填充、下载为图像或导出为PDF的交互式日历,用于显示课时、考试时间、专业发展会议和机构活动。

预算规划分析工具:具有特定支出类别、成本分配和预算管理工具的教育机构预算文件。

学术文档:会议纪要、与成绩相关的电子邮件和学术诚信问题沟通、教师奖项推荐信、终身教职申诉、资助申请、面试邀请和委员会任命。

这些创作代表了从AI作为对话助手到AI作为创意合作者的转变,使教育工作者能够生产传统上需要大量专业技术或资源的个性化教育材料。

增强与自动化的平衡

我们的分析揭示了教育工作者如何平衡AI增强(协作使用)与自动化(完全委托任务)的细致画面,这建立在Anthropic先前关于经济指数的工作基础上。

教育工作者任务增强与自动化对比

教育工作者与Claude.ai对话中涉及增强(AI与用户协作执行任务)与自动化(AI直接执行任务)的百分比,针对给定的任务类别。我们确定了与美国劳工部O*NET职业信息数据库中教育工作者相关职业相关联的任务。我们将相似任务分组以创建高级任务类别,并在上图中报告。

不同教育任务的关键模式:

具有较高增强倾向的任务:

  • 大学教学和课堂指导,包括创建教育材料和练习题(77.4%增强);
  • 撰写资助提案以获得外部研究资金(70.0%增强);
  • 学术指导和组织学生指导(67.5%增强);
  • 监督学生学术工作(66.9%增强)。

具有相对较高自动化倾向的任务:

  • 管理教育机构财务和筹款(65.0%自动化);
  • 维护学生记录和评估学术表现(48.9%自动化);
  • 管理学术招生和注册(44.7%自动化)。

这种变化表明,教育工作者完全委托给AI的可能性取决于任务类型。与调查结果一致,我们看到涉及常规行政和财务管理的任务比接近直接学生互动的任务(如创建练习材料或指导博士级学术研究)更可能被完全委托。这些AI互动通常需要大量上下文,因此需要AI和教授之间的协作。例如,正如一位东北大学教授所言,在设计课程计划时,"AI需要关于材料级别和我们已覆盖内容的指导。"

教育工作者似乎也更有可能将AI用于需要创造力或复杂决策的工作,如撰写资助提案。在头脑风暴时,一位接受调查的教授写道:

"与LLM的对话是有价值的,而不是第一个回应。这也是我试图教学生的。把它当作思维伙伴,而不是思维替代品。"

尽管如此,48.9%的评分相关对话被识别为高度自动化仍然令人担忧。虽然受访教授认为这是AI效果最差的单一任务,但在Claude.ai数据中确实看到了这种情况。即使这仅占我们研究的Claude.ai对话的7%,它 emerged 作为第二高度自动化的任务。这包括诸如对学生作业提供反馈和使用评分标准评分他们的工作等子任务。虽然尚不清楚这些AI生成的内容在多大程度上影响最终成绩和反馈,但我们的研究确实显示了一定程度的委托给Claude。

在评分中使用AI仍然是教育工作者中的一个有争议的问题。一位东北大学教授分享道:"在伦理和实际操作上,我非常谨慎地避免以任何方式使用[AI工具]评估或建议学生。部分原因是准确性问题。我尝试了一些实验,让LLM评分论文,它们对我来说还不够好。在伦理上,学生不是为LLM的时间支付学费,他们是为我的时间付费。我有道德义务做好工作(或许在LLMs的帮助下)。"

虽然AI反馈可以通过自动系统提供形成性反馈(例如教育工作者在Claude Artifacts中构建的那些)来支持学生的发展,但大多数教育工作者似乎同意评分不应该接近完全自动化。

教育工作者AI应用图标

教育工作者如何重新思考教学内容

许多教育工作者认识到AI工具正在改变学生的学习方式。这反过来又给教育工作者改变教学方式带来了压力。正如一位接受调查的教授所言:

"AI迫使我彻底改变我的教学方式。我正在投入大量努力试图找出如何处理认知外包问题。"

它也在改变教授教授的内容。以编程为例,根据一位教授的说法,"基于AI的编程彻底改变了分析教学/学习体验。我们可以花时间讨论分析在业务中应用的概念,而不是调试逗号和分号。"

更广泛地说,评估AI生成内容的准确性正变得越来越重要。一位教授写道:"挑战是[随着]AI生成量的增加,人类验证和跟上变得越来越不堪重负。"教授们渴望帮助学生建立足够的学科专业知识,以具备这种辨别能力。

评估也开始呈现不同的面貌。虽然学生作弊和认知外包仍然是一个问题,但一些教育工作者正在重新思考他们的评估方式。

"如果Claude或类似的AI工具可以完成一项作业,我不担心学生作弊;我[担心]我们没有作为教育工作者做好自己的工作。"

在一位特定的东北大学教授的情况下,他们分享说,在太多学生提交AI撰写的作业后,他们"再也不会分配传统的研究论文"。相反,他们分享说:"我将重新设计作业,以便下次无法用AI完成。有一个学生抱怨每周家庭作业很难做,他们很恼火,因为Claude和ChatGPT对完成这项工作没用。我告诉他们这是一种赞美,我将努力更多地听到学生的这种反馈。"

一条前进的道路可能是基于这些新发现工具提升作业难度,并期望学生处理更复杂、现实世界的挑战,即使有AI帮助仍然困难。然而,鉴于AI的持续改进,这是一个移动的目标,可能会给教育工作者自己带来沉重的负担。此外,学生仍然需要独立于AI发展基础技能,以有效评估其输出。

局限性与考虑因素

这项研究伴随着重要的警示:

  • 识别方法:我们的筛选通过分析Claude对话来推断哪些与教育工作者相关,仅捕获了高等教育电子邮件对话的约1.5%,限制了我们的分析仅限于明确与教育工作者相关的任务(如创建教学大纲),并可能错过了许多其他不专门与教育工作者相关的教育工作者AI互动(如帮助解释困难概念);
  • 有限的教育工作者范围:分析仅限于具有高等教育电子邮件地址的账户,排除了K-12教师;
  • 早期采用者偏见:我们可能捕捉到已经对AI感到舒适的教育工作者,他们可能不代表更广泛教育工作者群体的技术准备情况或态度;
  • 调查局限性:东北大学教师数据提供了定性背景,但代表来自单一机构的有限样本,可能无法推广;
  • 平台特定性:此分析侧重于Claude.ai使用情况,可能无法反映其他AI平台上的模式;
  • 时间限制:5月和6月的分析窗口没有捕捉整个学年内教育工作者AI使用的季节性变化。

未来展望

我们的研究结果揭示了教育工作者AI采用的复杂图景。从构建交互式模拟到管理行政任务,应用的多样性显示了AI在学术功能中日益增长的存在。

或许最令人鼓舞的是教育工作者如何利用AI构建有形的教育资源。从AI作为对话工具到AI作为创意合作伙伴的转变,可能有助于解决教育中长期存在的资源限制。正如一位教授所指出的,曾经" prohibitively expensive"(时间)的定制模拟和交互式实验现在成为可能,为学生创造了更具吸引力的体验。

然而,围绕AI辅助评分仍然存在紧张关系。虽然我们数据中近一半的评分相关任务显示了自动化模式,但受访教师将此评为AI效果最差的应用。这种尝试与适当认知之间的脱节——突显了平衡效率收益与教育质量和伦理考虑的持续斗争。

这些结果表明,围绕教育中AI的叙事将继续随着技术本身而演变。教育工作者对适当AI使用的观点,特别是对评分等敏感任务,可能会随着工具的改进和最佳实践的出现而转变。对未来研究同样重要的是理解学生和教育工作者AI使用如何互动——当学生知道他们的教授正在使用AI时,他们如何看待和回应?教育工作者采用如何影响学生的学习行为?

我们的研究捕捉了教育工作者在积极实验的时刻,同时构建新的可能性并 grappling 关于AI增强课堂中他们角色的基本问题。前进的道路将需要持续的对话、谨慎的政策制定和持续的研究,以确保这些工具增强而非损害教育体验。