深度解析:AI如何革新教育工作,教师效能与伦理新挑战

1

AI对社会的影响

长期以来,关于人工智能在教育领域的讨论主要集中于学生如何利用大型语言模型辅助学习和写作。然而,教育工作者同样是AI技术的重要使用者。近期一项盖洛普调查显示,教师平均每周可利用AI工具节省5.9小时。有趣的是,与普遍认知相反,学生也开始对教授在课堂中使用AI表达担忧。

我们曾深入分析学生使用AI的数据。本报告则聚焦于教育专业人士:我们分析了来自全球高等教育专业人士在某AI平台进行的约74,000次匿名对话,并与一所知名大学合作,直接听取教职人员关于AI在大学内应用的心声。这些发现为教育工作者在大学环境中采纳AI提供了实证性快照。

主要研究发现:

  • 教育工作者在课堂内外广泛应用AI:他们的使用范围涵盖了开发课程材料、撰写研究基金申请、学术指导以及管理招生和财务规划等行政任务。
  • 教育工作者不限于使用聊天机器人,更倾向于构建定制化的AI工具:教师们正利用AI平台的交互式内容构建功能,创建互动式教育材料,例如化学模拟、自动化评分标准和数据可视化仪表盘。
  • 教育工作者倾向于自动化繁琐工作,而对于其他任务则保持深度参与:那些需要大量上下文、创造力或直接学生互动的任务,如设计课程、指导学生和撰写基金申请,教育工作者更倾向于将AI作为增强工具。相比之下,财务管理和记录保存等常规行政工作则更侧重于自动化。
  • 在学生评估方面,教育工作者立场不一,部分支持自动化评分,另一些则强烈反对:在某AI平台的数据中,教职人员使用AI进行评分和评估的频率相对较低,但在使用时,有48.9%的案例采用了自动化程度较高的方式(即AI直接执行任务)。尽管教育工作者普遍对自动化评估任务表示担忧,并且在调查中将其评为AI最不有效的领域,但这种现象依然存在。

识别教育工作者对AI平台的使用模式

本次研究运用了我们保护隐私的自动化分析工具,旨在揭示AI平台使用的广泛模式。研究高等教育专业人士使用某AI平台面临独特挑战,因为我们当前并未在其平台上收集用户职业数据。与学生经常明确提及课程或作业不同,教育工作者的AI互动涵盖教学、研究、行政和个人学习,使其更难识别和分类。

通过我们的隐私保护工具,我们分析了与高等教育电子邮件地址关联的AI平台免费和专业账户的对话,并自动筛选出与教育工作者特定任务相关的对话——例如创建教学大纲、批改作业或开发课程材料。此筛选过程在某时间段内产生了约74,000次对话。我们的分析应被视为对教育工作者如何将AI用于专业特定任务的探索,而非教育工作者所有AI用途的全面视图。

我们还将每次对话与美国劳工部职业信息O*NET数据库中全面的教育工作者任务列表进行匹配。我们将与“高等教育”教学或行政职业相关的任务定义为教育工作者任务。

此外,我们还结合了对22位早期采用AI的大学教职人员的调查数据和定性研究,以深入了解教育工作者的动机、担忧和使用模式。

教育工作者的常见AI应用

某AI平台分析和我们的定性研究均表明,AI最突出的用途是课程开发。该平台分析还指出,学术研究和评估学生表现分别位列第二和第三大常见用途。

图示数据分析:教育工作者三大AI用途

根据对74,000次AI平台对话的分析,教育工作者在AI上的三大主要用途是:

  1. 开发课程(占分析对话的57%):在此类任务中,AI增强型方法(AI与用户协作完成任务)与自动化方法(AI直接执行任务)的使用比例,增强型明显高于自动化。
  2. 进行学术研究(占13%):与课程开发类似,学术研究也更侧重于AI增强。
  3. 评估学生表现(占7%):在此类别中,AI自动化应用程度相对较高,接近50%。

我们的调查中,大学教职人员还报告将AI用于自身学习(平均占用其AI使用时间的29%)。然而,由于筛选机制以及在这些学习场景中区分学生和教育工作者使用情况的难度,某AI平台分析并未深入研究此项。

我们发现的AI平台数据中其他一些特别有趣的用途包括:

  • 为教育模拟创建模拟法律场景;
  • 开发职业教育和劳动力培训内容;
  • 起草学术或专业申请的推荐信;
  • 创建会议议程及相关行政文件。

教职人员为何青睐AI应用

我们对大学教职人员的定性研究揭示了教育工作者倾向于这些常见AI应用的原因:

  1. 自动化繁琐任务:“它负责处理那些单调乏味的工作”;有助于处理“筹款中的重复性部分”。
  2. 作为协作型思想伙伴:“AI能找到我未曾想到的有效方式向学生解释概念”。
  3. 为学生提供个性化学习体验:“AI对于为学生和我提供超越单一教师所能提供的个性化、互动式学习体验非常有用”。

教育工作者如何利用AI构建定制工具

最令人鼓舞的发现之一是,教育工作者如何利用AI平台的交互式功能创建互动式教育材料。他们不仅仅是进行对话,而是常常构建完整、实用的资源,在某些情况下可以立即投入课堂使用。

正如一位受访的大学教职人员所说:“以前因时间成本过高而难以实现的事情,现在变得可能。定制模拟、插图、互动实验。这太棒了,能让学生更投入。”

教育工作者利用AI平台构建的关键成果包括:

  • 互动教育游戏:基于网络的逃生室、平台游戏和模拟,通过游戏化方式教授各个学科和级别的概念。
  • 评估与评价工具:基于HTML的自动反馈测验、用于分析学生表现的CSV数据处理器以及全面的评分标准。
  • 数据可视化:互动式展示,帮助学生可视化从历史时间线到科学概念的一切。
  • 学科特定学习工具:如化学计量学游戏、带自动反馈的遗传学测验以及计算物理模型等专业资源。
  • 学术日历与日程安排工具:可以自动填充、下载为图片或导出为PDF的互动日历,用于显示课程时间、考试时间、专业发展会议和机构活动。
  • 预算规划与分析工具:针对教育机构的预算文件,包含特定支出类别、成本分配和预算管理工具。
  • 学术文档:会议纪要、与成绩相关的沟通邮件、学术诚信问题邮件、教职员工奖项推荐信、终身教职申诉、研究基金申请、面试邀请和委员会任命等。

这超越了单一AI平台。一位教授描述了新的AI工具如何普遍使他们能够“将自己的内容转化为更易访问/更具吸引力的形式(互动页面、模拟、播客、视频)”。这些创新代表了从AI作为对话助手向AI作为创意合作者的转变,使教育工作者能够生产出传统上需要大量技术专长或资源的个性化教育材料。

增强与自动化之间的平衡

我们的分析揭示了教育工作者如何在AI增强(协作使用)与自动化(完全委派任务)之间取得平衡的微妙图景,这建立在我们之前关于AI经济影响指数的工作之上。

图示数据分析:教育工作者任务的增强与自动化比例

该图表展示了12种不同的学术任务(如大学教学、基金撰写、学术指导等)中,AI增强型方法与自动化方法的百分比细分。大多数任务显示出对增强型方法的更高偏好,但不同任务类别的百分比有所不同。具体而言,某些任务的AI增强趋势更明显,而另一些则更偏向自动化。

某AI平台数据中不同教育任务呈现出关键模式:

增强趋势较高的任务:

  • 大学教学和课堂指导,包括创建教育材料和练习题(77.4%为增强型);
  • 撰写研究基金申请以获得外部研究资金(70.0%为增强型);
  • 学术指导和学生组织指导(67.5%为增强型);
  • 监督学生学术工作(66.9%为增强型)。

自动化趋势相对较高的任务:

  • 管理教育机构财务和筹款(65.0%为自动化型);
  • 维护学生记录和评估学业表现(48.9%为自动化型);
  • 管理学术招生和入学(44.7%为自动化型)。

这种差异表明,教育工作者完全委托给AI的可能性取决于任务性质。与我们的调查结果一致,我们发现涉及日常行政和财务管理的任务更可能被完全委托,而那些与直接学生互动密切的任务(如创建练习材料或指导博士级学术研究)则更倾向于协作。这些AI互动通常需要大量上下文,因此需要AI与教授之间的协作。例如,正如一位大学教授所说,在设计课程计划时,“AI需要关于材料水平和我们已涵盖内容的上下文指导”。

教育工作者似乎也更可能以增强的方式使用AI进行需要创造力或复杂决策的工作,例如撰写基金申请。在头脑风暴时,一位受访教授写道:“与大型语言模型的对话才是有价值的,而不是第一个回应。这也是我试图教给学生的东西。将其作为思想伙伴,而不是思想替代品。”

尽管如此,48.9%的评分相关对话被识别为自动化程度较高,这一点仍然令人担忧。尽管受访教授认为这是AI“最不有效”的任务,但它却出现在某AI平台数据中。即使这仅占我们研究的AI平台对话的7%,它仍然是自动化程度第二高的任务。这包括提供学生作业反馈和使用评分标准批改作业等子任务。虽然尚不清楚这些AI生成的回复在最终成绩和反馈中所占的权重,但我们的研究揭示的互动确实显示出一定程度的对AI的委派。

在教育工作者中,使用AI进行评分仍然是一个有争议的问题。一位大学教授分享道:“从伦理和实践角度看,我非常警惕以任何方式使用AI工具来评估或指导学生。部分原因是准确性问题。我曾尝试一些实验,让大型语言模型批改论文,但它们根本不够好。从伦理角度讲,学生支付学费是为了我的时间,而不是大型语言模型的时间。尽职尽责是我的道德义务(也许可以借助大型语言模型)。”

虽然AI反馈可以通过自动系统提供形成性反馈等方式支持学生发展(例如教育工作者在AI平台自定义工具中构建的系统),但大多数教育工作者似乎同意,评分不应接近完全自动化。

教育工作者如何重新思考教学内容

许多教育工作者认识到,AI工具正在改变学生的学习方式。这反过来又促使教育工作者改变他们的教学方式。正如一位受访教授所说:“AI迫使我彻底改变教学方式。我正在付出大量努力,试图弄清如何应对认知卸载问题。”

它也正在改变教授们的教学内容。例如,在编程领域,一位教授表示:“基于AI的编程彻底革新了分析教学/学习体验。我们不必再花费时间调试逗号和分号,而是可以专注于讨论分析在商业应用中的概念。”

更广泛而言,评估AI生成内容准确性的能力正变得越来越重要。“挑战在于,随着AI生成内容的增加,人类验证和跟上节奏变得越来越力不从心,”一位教授写道。教授们热衷于帮助学生在某一学科领域建立足够的专业知识,以具备这种辨别力。

评估方式也开始变得不同。尽管学生作弊和认知卸载仍然令人担忧,但一些教育工作者正在重新思考他们的评估方式。“如果某AI工具能够完成一项作业,我不会担心学生作弊;我担心的是我们作为教育工作者没有尽到职责。”

在一位特定大学教授的案例中,他们分享说,在努力应对太多学生提交AI撰写作业的困扰后,他们“再也不会布置传统的学术论文”了。相反,他们分享道:“下次我会重新设计作业,使其无法用AI完成。曾有一名学生抱怨每周的作业很难做,他们感到恼火,因为某AI工具在完成作业方面毫无用处。我告诉他们这是一种赞扬,我将努力从学生那里听到更多这样的话。”

未来的一个方向可能是根据这些新工具提升作业难度,并期望学生能够应对更复杂、更真实的挑战,即使有AI辅助也仍然困难。然而,鉴于AI的持续改进,这是一个不断变化的目标,并可能给教育工作者本身带来巨大负担。此外,学生仍然需要在独立于AI的情况下发展基本技能,才能有效评估其输出结果。

局限性与注意事项

这项研究也伴随着重要的局限性:

  • 识别方法:我们的筛选方法,即通过某AI平台的对话推断哪些与教育工作者相关,仅捕获了高等教育电子邮件中约1.5%的对话,这限制了我们只能关注明确与教育工作者相关的任务(例如创建教学大纲),并可能遗漏许多其他并非专门与教育工作者相关的AI互动(例如寻求解释复杂概念的帮助)。
  • 教育工作者范围有限:分析仅限于拥有高等教育电子邮件地址的账户,不包括K-12教师。
  • 早期采用者偏见:我们可能主要捕捉到了已经熟悉AI的教育工作者,他们可能无法代表更广泛教育群体在技术准备或态度上的情况。
  • 调查局限性:某大学教职人员的数据提供了定性背景,但代表了来自单一机构的有限样本,可能不具有普遍性。
  • 平台特异性:本次分析侧重于某AI平台的使用,可能无法反映其他AI平台上的模式。
  • 时间限制:分析窗口期并未捕捉到整个学年期间教育工作者AI使用的季节性变化。

展望未来

我们的研究揭示了教育工作者采纳AI的复杂图景。从构建互动模拟到管理行政任务,应用的多样性表明AI在学术功能中的影响力日益扩大。

最令人鼓舞的或许是教育工作者如何利用AI构建切实的教育资源。这种从AI作为对话工具转向AI作为创意伙伴的转变,可能有助于解决教育领域长期存在的资源限制问题。正如一位教授所指出,曾经因时间成本“高昂得令人望而却步”的定制模拟和互动实验,现在已成为可能,为学生创造了更具吸引力的体验。

然而,AI辅助评分方面仍然存在争议。尽管在我们的数据中,近一半的评分相关任务显示出自动化模式,但受访教职人员却将其评为AI最不有效的应用。这种尝试与适宜性之间的脱节——在追求效率提升与保障教育质量及伦理考量之间——突显了持续存在的挣扎。

这些发现表明,围绕AI在教育中的叙事将随着技术本身的发展而不断演变。教育工作者对AI适当使用的看法,尤其是在评分等敏感任务上,可能会随着工具的改进和最佳实践的出现而改变。对于未来研究同样重要的是,要了解学生和教育工作者AI使用如何相互作用——当学生知道教授使用AI时,他们如何感知和回应?教育工作者的采纳如何影响学生的学习行为?

我们的研究捕捉了教育工作者在积极实验的时刻,他们正在构建新的可能性,同时也努力解决AI增强型课堂中关于自身角色的根本问题。未来的道路将需要持续的对话、仔细的政策制定和不懈的研究,以确保这些工具能够提升而非损害教育体验。