在AI与教育融合的讨论中,人们的目光往往聚焦于学生如何利用大型语言模型辅助学习和写作。然而,教育工作者同样在积极拥抱AI技术。根据最近的盖洛普调查,教师报告称AI工具每周平均为他们节省5.9小时的工作时间。颇具讽刺意味的是,学生开始对教授在课堂中使用AI表达担忧,这与通常的讨论方向形成了鲜明对比。
我们之前曾报道过学生使用AI的数据,而新的分析则聚焦于教授:我们分析了今年5月和6月期间,全球约74,000名高等教育专业人员在Claude.ai上的匿名对话。¹ 我们还与东北大学合作,直接了解教职员工如何在大学内使用AI。我们的发现提供了教育工作者AI采用情况的实证快照,特别是在大学环境中。
教育工作者的AI应用全景
我们的研究发现了一系列引人注目的趋势:
- 课堂内外的AI应用:教育工作者的应用范围从开发课程材料和撰写资助提案到学术指导以及管理招生和财务规划等行政任务。
- 从聊天机器人到定制工具:教育工作者不仅使用聊天机器人,还在使用AI构建自己的定制工具,如交互式教育材料。
- 自动化繁琐工作,保留核心决策:教育工作者倾向于自动化繁琐工作,同时在其他方面保持参与。
- 评分自动化争议:一些教育工作者正在自动化评分工作,而另一些人则对此持强烈反对态度。
研究方法:揭示教育工作者的Claude使用模式
在这项研究中,我们使用了我们的自动化分析研究工具,该工具可以揭示Claude使用的广泛模式,同时保护用户隐私。
研究高等教育专业人员对Claude.ai的使用面临着独特挑战,因为我们目前不在平台上收集自我报告的职业数据。与经常明确提及课程作业或作业的学生不同,教育工作者的AI交互跨越教学、研究、管理和个人学习,使它们更难识别和分类。
使用我们的隐私保护工具,我们分析了与高等教育电子邮件地址关联的Claude.ai免费版和专业版账户的对话,然后自动筛选出教育工作者特定的任务对话——如创建教学大纲、评分作业或开发课程材料。² 这种筛选产生了大约74,000个5月和6日期间的对话。
我们还与22名东北大学教职员工进行了调研和定性研究,这些教职员工是AI的早期采用者,以阐明教育工作者的动机、担忧和使用模式。
教育工作者的常见AI应用
根据我们的Claude.ai分析和与东北大学的定性研究,AI最突出的用途是课程开发。我们的Claude.ai分析还显示,学术研究和评估学生表现是第二和第三最常见的用途。
基于74,000个Claude.ai对话数据的教育工作者前三名AI用途:开发课程(分析的57%)、进行学术研究(13%)和评估学生表现(7%)。
在我们的调查中,东北大学教职员工报告称另一个常见案例是使用AI进行自己的学习(平均占他们AI时间的29%)。然而,由于筛选机制和在这些学习实例中区分学生和教育工作者使用的难度,这一点在我们的Claude.ai分析中未进行研究。
我们在Claude.ai数据中发现的一些其他特别有趣的用途包括:
- 为教育模拟创建模拟法律场景;
- 开发职业教育和劳动力培训内容;
- 为学术或专业申请起草推荐信;
- 创建会议议程和相关行政文件。
教育工作者使用AI的原因
我们与东北大学教育工作者的定性研究揭示了教育工作者经常倾向于这些常见AI用途的原因:
- 自动化繁琐任务("它处理繁琐的任务";帮助"筹款中的机械部分");
- 协作思考伙伴("AI能找到有效的方法向学生解释我自己未曾想到的概念");
- **为学生提供个性化学习体验"(AI对于给学生和我提供个性化的、互动的学习体验非常有用,这是单一教师无法提供的")。
教育工作者如何用AI构建定制工具
最鼓舞人心的发现之一是教育工作者如何使用Claude的Artifacts功能创建交互式教育材料。他们不仅仅是进行对话,而是在构建完整的、功能性的资源,在某些情况下可以立即在课堂中部署。
正如一位接受调查的东北大学教授所说:"以前 prohibitively expensive(时间)的事情现在变得可能了。自定义模拟、插图、交互式实验。哇。对学生来说更具吸引力。"
教育工作者创建的关键工具
交互式教育游戏: 基于网络的游戏,包括密室逃脱、平台游戏和模拟,通过各种主题和级别通过游戏化教授概念
评估和评估工具: 具有自动反馈系统的基于HTML的测验、用于分析学生表现的CSV数据处理器和全面的评分标准
数据可视化: 交互式显示,帮助学生可视化从历史时间线到科学概念的一切
学科特定学习工具: 专业资源,如化学计量游戏、具有自动反馈的遗传学测验和计算物理模型
学术日历和调度工具: 交互式日历,可以自动填充、下载为图像或导出为PDF,用于显示课程时间、考试时间、专业发展会议和机构活动
预算规划和分析工具: 具有特定支出类别、成本分配和预算管理工具的教育机构预算文件
学术文档: 会议记录、与成绩相关的通信和学术诚信问题的电子邮件、教师奖项的推荐信、终身教职上诉、资助申请、面试邀请和委员会任命
这不仅仅是Claude。一位教授描述了新的AI工具如何使他们能够"将自己的内容转化为更易于理解/参与的形式(交互式页面、模拟、播客、视频)。"
这些创作代表了从AI作为对话助手到AI作为创意合作伙伴的转变,使教育工作者能够生产传统上需要大量专业技术或资源的个性化教育材料。
增强与自动化的平衡
我们的分析揭示了教育工作者如何平衡AI增强(协作使用)与自动化(完全委托任务),这建立在Anthropic先前关于经济指数的工作基础上。
Claude.ai中教育工作者对话的百分比涉及增强(AI与用户协作执行任务)与自动化(AI直接执行任务*),针对给定的任务类别。
Claude.ai数据中的不同教育任务出现了关键模式:
增强倾向较高的任务:
- 大学教学和课堂指导,包括创建教育材料和练习问题(77.4%增强);
- 撰写资助提案以获取外部研究资金(70.0%增强);
- 学术指导和组织学生指导(67.5%增强);
- 监督学生学术工作(66.9%增强)。
自动化倾向相对较高的任务:
- 管理教育机构财务和筹款(65.0%自动化);
- 维护学生记录和评估学术表现(48.9%自动化);
- 管理学术招生和入学(44.7%自动化)。
这种变化表明,教育工作者完全委托给AI的可能性取决于任务。与我们调查结果一致的是,我们看到涉及常规行政和财务管理的任务比接近直接学生互动的任务(如创建练习材料或指导博士级学术研究)更有可能被完全委托。这些AI交互通常需要大量上下文,因此需要AI和教授之间的协作。例如,正如一位东北大学教授所说,在设计课程计划时,"AI需要关于材料级别和我们已涵盖内容的指导。"
教育工作者似乎也更有可能在工作需要创造力或复杂决策时以增强方式使用AI,例如撰写资助提案。在头脑风暴时,一位接受调查的教授写道:
"与LLM的对话是有价值的,而不是第一个回应。这也是我尝试教学生的。把它当作思考伙伴,而不是思考替代品。"
话虽如此,在评分相关对话中,48.9%被识别为自动化密集型仍然令人担忧。尽管接受调查的教授认为这是AI效果最差的单一任务,但在Claude.ai数据中确实看到了这一点。即使这仅占我们研究的Claude.ai对话的7%,它 emerged as the second most automation-heavy task。这包括使用评分标准对学生作业提供反馈和评分等子任务。虽然尚不清楚这些AI生成的响应在多大程度上影响最终成绩和反馈,但我们的研究确实显示了一定程度的委托给Claude。
评分自动化争议
在评分中使用AI仍然是教育工作者之间的有争议的问题。一位东北大学教授分享道:"在伦理和实践上,我非常谨慎地使用[AI工具]以任何方式评估或指导学生。部分原因是准确性问题。我尝试了一些实验,让LLM评分论文,它们对我来说还不够好。在伦理上,学生不是为LLM的时间支付学费,他们是为我的时间付费。我有义务做好工作(也许在LLMs的帮助下)。"
虽然AI反馈可以通过自动系统提供形成性反馈(例如教育工作者在Claude Artifacts中构建的那些)来支持学生的发展,但大多数教育工作者似乎同意评分不应该接近完全自动化。
教育工作者如何重新思考教学内容
许多教育工作者认识到AI工具正在改变学生的学习方式。这反过来又给教育工作者改变教学方式带来了压力。正如一位接受调查的教授所说:
"AI迫使我彻底改变我的教学方式。我正在花费大量努力试图弄清楚如何处理认知卸载问题。"
它也在改变教授教授的内容。以编程为例,根据一位教授的说法,"基于AI的编程完全彻底改变了分析教学/学习体验。我们不再调试逗号和分号,而是可以花时间讨论分析在业务应用中的概念。"
更广泛地说,评估AI生成内容的准确性变得越来越重要。一位教授写道:"挑战在于随着AI生成量的增加,人类验证和保持领先变得越来越不堪重负。"教授们热衷于帮助学生在特定领域建立足够的专业知识来做出这种判断。
评估也开始呈现不同的面貌。虽然学生作弊和认知卸载仍然是一个问题,但一些教育工作者正在重新思考他们的评估方式。
"如果Claude或类似的AI工具可以完成一项作业,我不担心学生作弊;我[担心]我们没有做好作为教育工作者[的工作]。"
在一位特定的东北大学教授的情况下,他们分享说,在太多学生提交AI撰写的作业后,他们"永远不会再次分配传统的研究论文"。相反,他们分享:"我将重新设计作业,以便下次无法用AI完成。有一个学生抱怨每周作业很难做,他们很恼火,因为Claude和ChatGPT在完成工作时毫无用处。我告诉他们这是一种赞美,我会努力更多地听到学生的这种反馈。"
一条前进的路径可能是基于这些新发现的工具提升作业水平,并期望学生处理更复杂的、即使有AI帮助仍然困难的现实世界挑战。然而,鉴于AI的不断改进,这是一个移动的目标,可能给教育工作者自己带来重大负担。此外,学生仍然需要独立于AI发展基础技能,以有效评估其输出。
局限性与考虑因素
这项研究伴随着重要的警告:
- 识别方法:我们的筛选通过查看Claude对话来推断哪些与教育工作者相关,仅捕获了高等教育电子邮件对话的约1.5%,限制了我们仅限于明确链接到教育工作者的任务(例如创建教学大纲),并且可能错过了许多其他不专门与教育工作者相关的教育工作者AI交互(例如获得帮助解释困难概念);
- 有限的教育工作者范围:分析仅限于具有高等教育电子邮件地址的账户,排除了K-12教师;
- 早期采用者偏见:我们可能已经捕捉到已经对AI感到舒适的教育工作者,他们可能不代表更广泛教育工作者群体的技术准备情况或态度;
- 调查局限性:东北大学教职员工数据提供了定性背景,但代表来自单一机构的有限样本,可能无法推广;
- 平台特异性:此分析侧重于Claude.ai使用情况,可能无法反映其他AI平台上的模式;
- 时间限制:5月和6月的分析窗口没有捕捉整个学年中教育工作者AI使用的季节性变化。
未来展望
我们的发现揭示了教育工作者AI采用的复杂图景。从构建交互式模拟到管理行政任务,应用多样性显示了AI在学术功能中日益扩大的存在。
也许最令人鼓舞的是教育工作者如何使用AI构建有形的教育资源。这种从AI作为对话工具到AI作为创意合作伙伴的转变可能有助于解决教育中长期存在的资源限制问题。正如一位教授所指出的,曾经" prohibitively expensive"(时间)的自定义模拟和交互式实验现在成为可能,为学生创造了更具吸引力的体验。
然而,AI辅助评分仍然存在紧张关系。在我们的数据中,近一半的评分相关任务显示了自动化模式,但接受调查的教职员工将此评为AI效果最差的应用。这种尝试与被视为适当之间的脱节——突显了持续努力平衡效率收益与教育质量和伦理考虑。
这些发现表明,围绕教育中AI的叙述将继续随着技术本身的发展而演变。教育工作者对适当AI使用的看法,特别是对于评分等敏感任务,可能会随着工具的改进和最佳实践的出现而转变。对未来研究同样重要的是理解学生和教育工作者AI使用之间的互动——当学生知道他们的教授正在使用AI时,他们如何看待和回应?教育工作者采用如何影响学生的学习行为?
我们的研究捕捉了教育工作者在一个积极实验的时刻,在构建新可能性的同时,也在努力思考他们在AI增强课堂中的角色。前进的道路将需要持续的对话、谨慎的政策制定和持续的研究,以确保这些工具增强而非损害教育体验。
结语
AI在教育领域的应用正在从简单的辅助工具转变为教育创新的催化剂。教育工作者通过Claude等AI工具,不仅提高了工作效率,更是在重塑教育的本质。从创建个性化学习体验到重新设计评估方式,教师们正在探索AI如何赋能而非替代人类教育者的核心价值。
随着技术的不断进步,教育工作者与AI的协作模式将继续演化。关键在于保持对教育本质的关注,确保技术始终服务于培养批判性思维、创造力和人文关怀这些人类独有的教育目标。AI不是教育的终点,而是通往更个性化、更高效、更包容教育新路径的起点。