AI在高等教育中的革新:教师如何利用智能工具重塑教学与管理?

1

智能浪潮下的教育转型:深度解析教师如何运用AI

近年来,人工智能(AI)在教育领域的崛起引发了广泛讨论,尤其关注学生如何利用大型语言模型辅助学习与写作。然而,另一项同样重要却常被忽视的趋势是教育工作者对AI工具的采纳。美国盖洛普公司的一项调查显示,教师平均每周通过AI工具节省了5.9小时。有趣的是,以往多是学生对AI在课堂中的使用感到担忧,现在反而是学生开始关注教授在教学中运用AI的现象。

我们此前已发布关于大学生AI使用情况的报告,本次研究则聚焦于高等教育阶段的教师群体。我们分析了来自全球高等教育专业人士在Claude.ai上进行的约7.4万次匿名对话(发生在过去两个月内),并与美国东北大学合作,直接听取了该校教职员工关于AI应用的一线反馈。这些发现共同描绘了教育工作者AI采纳现状的实证图景,尤其是在大学环境中。

主要研究发现包括:

  • 教育工作者在课堂内外广泛使用AI: AI的应用场景涵盖了从开发课程材料、撰写研究基金申请,到学业指导、以及管理招生和财务规划等行政任务。
  • 教师不仅使用聊天机器人,更利用AI构建定制工具: 教师们正在利用Claude的Artifacts功能创建互动式教育材料,例如化学模拟器、自动化评分标准和数据可视化仪表板。
  • 教师倾向于自动化繁琐工作,并在其他方面保持协作: 对于需要大量上下文、创造性思维或直接学生互动的工作——如设计课程、指导学生和撰写研究基金申请——教师更倾向于将AI作为增强工具。相比之下,财务管理和记录保存等常规行政工作则更侧重于自动化。
  • 在学生评估方面,部分教师倾向自动化,而另一些则坚决反对: 在Claude.ai的数据中,教师使用AI进行评分和评估的频率相对较低。但在实际使用时,有48.9%的案例显示教师采用自动化方式(即AI直接执行任务)。尽管教育工作者普遍对评估任务的自动化心存顾虑,且受访教师普遍认为这是AI效率最低的领域,这一数据仍值得深思。

教师AI使用模式的识别与分析

本研究运用了我们内部开发的自动化分析工具,该工具能够在保护用户隐私的前提下,揭示Claude使用模式的宏观趋势。识别高等教育专业人士在Claude.ai上的使用情况面临独特挑战,因为平台当前并未收集用户的职业信息。与学生经常明确提及课程或作业不同,教育工作者的AI互动涵盖了教学、科研、行政及个人学习等多个方面,使得识别和分类更具复杂性。

通过这一隐私保护工具,我们分析了与高等教育邮箱地址关联的Claude.ai免费和专业账户的对话记录,并随后自动筛选出针对教育工作者特定任务的对话,例如创建课程大纲、批改作业或开发教学材料。这一筛选过程最终提取了5月至6月期间约7.4万次相关对话。因此,我们的分析应被视为对教育工作者如何将AI用于专业特定任务的探索,而非对其所有AI使用情况的全面概览。

此外,我们还将每段对话与美国劳工部职业信息数据库O*NET中一份全面的教育工作者任务列表进行匹配。我们识别出与“高等教育”教学或行政职业相关的任务。为了补充定量分析,我们还从美国东北大学的22位早期AI使用者教职员工那里收集了问卷调查和定性研究数据,以深入了解教育工作者的动机、担忧和使用模式。

教育工作者的常见AI应用场景

根据Claude.ai数据分析和对东北大学教师的定性研究,AI最突出的用途是课程开发。其次,学术研究和评估学生表现分别位列第二和第三大常见用途。

具体的AI用途比例显示:课程开发占总对话的57%;进行学术研究占13%;评估学生表现占7%。在这些应用中,AI增强与自动化的使用比例也清晰可见,整体而言,AI增强模式在大多数场景下更受青睐。

在我们的调查中,东北大学的教师们还提到一个普遍用途是利用AI进行自我学习(平均占其AI使用时间的29%)。然而,由于筛选机制和区分学生与教师学习场景的难度,这一用途并未纳入Claude.ai的分析范围。

除了上述主要用途,我们在Claude.ai数据中还发现了一些特别有趣的AI应用案例,包括:

  • 创建模拟法律场景,用于教育模拟;
  • 开发职业教育和劳动力培训内容;
  • 起草学术或专业申请的推荐信;
  • 创建会议议程及相关行政文件。

教师选择AI辅助的深层动因

我们对东北大学教师的定性研究揭示了教育工作者倾向于这些常见AI用途背后的原因:

  1. 自动化繁琐任务: AI能够“处理枯燥的任务”,并“协助筹款中重复性部分的工作”。
  2. 作为协作型思想伙伴: “AI能够找到我从未想过、更有效地向学生解释概念的方法”。
  3. 为学生提供个性化学习体验: “AI对于为学生和我提供超越单一教师所能提供的个性化、互动式学习体验非常有用”。

教师如何利用AI构建自定义工具

本研究中最令人鼓舞的发现之一是教育工作者如何利用Claude的Artifacts功能创建交互式教育材料。他们不再仅仅停留在对话层面,而是积极构建完整、功能性的资源,其中一些甚至可以直接应用于课堂教学。

正如一位受访的东北大学教师所言:“以前需要投入巨大时间成本(以至于难以实现)的事情,现在变得可能了。定制模拟、插图、互动实验——这太棒了!学生们的参与度也大大提高。”

教育工作者利用AI构建的关键工具包括:

  • 互动式教育游戏: 涵盖密室逃脱、平台游戏和模拟等多种网络游戏,通过游戏化方式教授不同学科和级别的概念。
  • 评估与评价工具: 基于HTML的带有自动反馈系统的测验、用于分析学生表现的CSV数据处理器以及全面的评分标准。
  • 数据可视化工具: 交互式展示,帮助学生将历史时间线到科学概念的一切进行可视化。
  • 特定学科学习工具: 专业资源,如化学计量游戏、带有自动反馈的遗传学测验以及计算物理模型。
  • 学术日历与排程工具: 交互式日历,可以自动填充、下载为图片或导出为PDF,用于显示课程时间、考试时间、专业发展会议和机构活动。
  • 预算规划与分析工具: 针对教育机构的预算文档,包含特定的开支类别、成本分配和预算管理工具。
  • 学术文档: 会议纪要、成绩相关沟通邮件、学术诚信问题邮件、教职员工奖项推荐信、终身教职申诉、研究基金申请、面试邀请和委员会任命。

这些AI辅助的创造物标志着AI从会话助手向创意合作者的转变,使教育工作者能够制作个性化的教育材料,而这些材料在传统上可能需要大量的技术专长或资源。

AI增强与自动化的应用光谱

我们的分析揭示了教育工作者如何平衡AI增强(协作使用)与自动化(完全委托任务)的细微差别,这进一步丰富了Anthropic在经济指数方面的早期研究。

在Claude.ai数据中,不同教育任务呈现出关键的使用模式:

AI增强倾向更高的任务:

  • 大学教学和课堂指导,包括创建教学材料和练习题(77.4%增强);
  • 撰写研究基金申请以获得外部研究资助(70.0%增强);
  • 学业指导和学生组织导师工作(67.5%增强);
  • 监督学生学术工作(66.9%增强)。

AI自动化倾向相对更高的任务:

  • 管理教育机构财务和筹款(65.0%自动化);
  • 维护学生记录和评估学术表现(48.9%自动化);
  • 管理学术招生和入学(44.7%自动化)。

这种差异表明,教育工作者完全将任务委托给AI的可能性取决于任务本身的性质。与我们的调查结果一致,我们发现涉及日常行政和财务管理的任务更可能被完全委托,而那些与直接学生互动密切相关的任务(如创建练习材料或指导博士级学术研究)则更倾向于增强式使用。这些AI互动往往需要大量的上下文理解,因此需要AI与教授之间的紧密协作。例如,正如一位东北大学教授所说,在设计教案时,“AI需要关于材料难度和已涵盖内容的上下文指导。”

教育工作者似乎也更倾向于以增强方式使用AI处理需要创造力或复杂决策的工作,例如撰写研究基金申请。在头脑风暴时,一位受访教授写道:“与大型语言模型的对话才是有价值的,而不是它给出的第一个回应。这也是我试图教给学生们的。把它当作一个思考伙伴,而不是思考的替代品。”

然而,仍有48.9%的评分相关对话被识别为自动化程度较高,这仍然令人担忧。尽管受访教授认为这是AI效率最低的单一任务,但它却在Claude.ai数据中有所体现。即使这仅占我们研究的Claude.ai对话的7%,它仍然是自动化程度第二高的任务。这包括了对学生作业提供反馈和使用评分标准批改作业等子任务。虽然尚不清楚这些AI生成的回应在最终成绩和反馈中所占的比例,但我们的研究揭示的互动确实显示了部分任务的委托。关于AI在评分中的应用,教育工作者之间仍然存在争议。一位东北大学教授分享道:“从伦理和实践角度看,我非常警惕使用AI工具以任何方式评估或指导学生。其中一部分是准确性问题。我曾尝试让大型语言模型批改论文,但它们做得不够好。从伦理上讲,学生支付学费是为了获得我的时间,而不是大型语言模型的时间。我有道德义务做好工作(或许可以借助大型语言模型)。”

尽管AI反馈可以通过自动系统提供形成性反馈(例如教育工作者正在Claude Artifacts中构建的工具)来支持学生发展,但大多数教育工作者似乎都同意,评分不应接近完全自动化。

教师如何重新思考教学内容

许多教育工作者认识到AI工具正在改变学生的学习方式。这反过来也促使教育工作者反思并调整他们的教学方式。正如一位受访教授所言:“AI正迫使我彻底改变教学方式。我投入了大量精力试图解决认知卸载问题。”

AI也在改变教授们正在教授的内容。以编程为例,一位教授表示:“基于AI的编程彻底革新了分析教学/学习体验。我们不再需要调试逗号和分号,而是可以把时间花在讨论分析在商业应用中的概念上。”

更广泛地看,评估AI生成内容的准确性正变得越来越重要。“挑战在于,随着AI生成内容的增加,对人类而言,验证和掌握这些内容变得越来越难以承受,”一位教授写道。教授们渴望帮助学生在学科领域建立足够的专业知识以具备这种辨别能力。

评估方式也开始有所不同。尽管学生作弊和认知卸载仍然是担忧,但一些教育工作者正在重新思考他们的评估方式。“如果Claude或类似的AI工具能够完成一项作业,我不会担心学生作弊;我担心的是我们作为教育工作者没有尽到职责。”

例如,一位东北大学教授分享说,在遇到太多学生提交AI撰写作业后,他们“将永远不再布置传统的学术论文”。相反,他们分享道:“我将重新设计作业,使其下次无法通过AI完成。我曾有一名学生抱怨每周的家庭作业很难做,他们很恼火,因为Claude和ChatGPT在完成作业方面毫无用处。我告诉他们,这是一句赞美,我会努力从学生那里听到更多这样的话。”

未来的一个方向可能是基于这些新工具提升作业难度,并期望学生能够应对更复杂、更真实的挑战,即使有AI辅助也仍然难以完成。然而,考虑到AI的持续改进,这是一个不断变化的目标,并可能给教育工作者本身带来巨大负担。此外,学生仍然需要独立于AI发展基础技能,才能有效评估其输出。

研究的局限性与注意事项

本研究存在以下重要局限性:

  • 识别方法: 我们的筛选方法通过分析Claude对话来推断哪些与教育工作者相关,仅捕获了来自高等教育邮箱的约1.5%的对话,这限制了我们只能关注明确与教育工作者相关的任务(例如创建课程大纲),而可能错过了许多不完全与教育工作者专属的其他AI互动(例如寻求解释复杂概念的帮助)。
  • 教育者范围有限: 分析仅限于使用高等教育邮箱地址的账户,不包括K-12的教师。
  • 早期采用者偏差: 我们很可能捕获的是已经习惯使用AI的教育工作者,他们可能无法代表更广泛教育群体对技术的准备程度或态度。
  • 调查局限性: 东北大学教师的数据提供了定性背景,但仅代表单一机构的有限样本,可能不具有普遍性。
  • 平台特异性: 本分析侧重于Claude.ai的使用情况,可能无法反映其他AI平台上的模式。
  • 时间限制: 5月和6月的分析窗口未能捕捉到整个学年教育工作者AI使用情况的季节性变化。

展望未来

我们的研究揭示了教育工作者采纳AI的复杂图景。从构建交互式模拟到管理行政任务,AI在各种学术功能中日益扩展的存在。最令人鼓舞的或许是教育工作者如何利用AI构建实实在在的教育资源。这种从AI作为会话工具到AI作为创意伙伴的转变,有助于解决教育领域长期存在的资源限制问题。正如一位教授所指出,曾经“耗时过高”的定制模拟和互动实验现在成为可能,为学生创造了更具吸引力的体验。

然而,AI辅助评分仍然存在争议。尽管近一半的评分相关任务在我们的数据中显示出自动化模式,但受访教师将其评为AI效率最低的应用。这种尝试与适宜性认知之间的脱节,凸显了平衡效率提升与教育质量及伦理考量之间持续存在的矛盾。

这些发现表明,随着技术本身的发展,关于AI在教育中的叙事将继续演变。教育工作者对AI适当使用的看法,特别是对于评分等敏感任务,可能会随着工具的改进和最佳实践的出现而改变。未来研究同样重要的是理解学生与教育工作者AI使用之间的互动——当学生知道教授正在使用AI时,他们如何感知和回应?教育工作者的采纳如何影响学生的学习行为?

我们的研究捕捉到教育工作者在一个积极实验的时刻,他们正在创造新的可能性,同时也面临着关于自身在AI增强课堂中角色的一些根本性问题。未来的道路将需要持续的对话、审慎的政策制定和不懈的研究,以确保这些工具能够增强而非损害教育体验。