在人工智能与教育融合的浪潮中,讨论焦点往往集中在学生如何利用大型语言模型辅助学习和写作。然而,教师群体对AI的应用同样值得关注且影响深远。根据最近的盖洛普调查,教师报告称AI工具每周平均为他们节省5.9小时工作时间。有趣的是,讨论方向发生了反转,学生开始表达对教授在课堂中使用AI的担忧。
我们之前曾报道过学生使用AI的数据,而新的分析则聚焦于教授群体:我们分析了今年5月至6月期间,全球高等教育专业人员在Claude.ai平台上的约74,000份匿名对话。此外,我们还与东北大学合作,直接了解教职员工如何在大学环境中使用AI。我们的发现为教育者AI采用情况提供了实证快照,特别是在大学环境中。
教师AI应用的多元场景
研究发现,教师对AI的应用远超课堂范畴,涵盖了从开发课程材料、撰写资助提案到学术咨询和管理招生、财务规划等行政任务等多个方面。
从对话工具到创意伙伴
教师们不仅在使用聊天机器人,更在利用AI构建自己的定制工具。通过Claude的Artifacts功能,教师们创建了互动教育材料,如化学模拟、自动评分标准和数据可视化仪表板。
一位受访的东北大学教授形象地描述了这一转变:"以前 prohibitively 昂贵(时间)的事情现在变得可能。定制模拟、插图、互动实验。哇。对学生来说更具吸引力。"
增强与自动化的平衡艺术
教师倾向于将AI应用于繁琐任务的自动化,同时保持对其他环节的掌控。需要大量上下文、创造力或直接与学生互动的任务——如设计课程、指导学生和撰写资助提案——教师更可能将AI作为增强工具使用。相比之下,常规行政工作如财务管理和记录保存则更倾向于自动化。
评分自动化仍是争议焦点。在我们的Claude.ai数据中,教师使用AI进行评分和评估的频率低于其他用途,但在使用时,48.9%的情况下采用了高度自动化的方式(AI直接执行任务)。尽管教育者对自动化评估任务存在担忧,且受访教师认为这是AI效果最差的领域。
研究方法与数据来源
本研究使用了我们的自动化分析研究工具,该工具能够揭示Claude使用的广泛模式,同时保护用户隐私。研究高等教育专业人员对Claude.ai的使用面临独特挑战,因为我们目前不在平台上收集自我报告的职业数据。
通过隐私保护工具,我们分析了与高等教育电子邮件地址关联的Claude.ai免费和付费账户的对话,然后自动筛选出教师特定任务的对话——如创建教学大纲、评分作业或开发课程材料。这一筛选过程获得了约74,000份5月至6月期间的对话。
我们还将每份对话与美国劳工部O*NET职业信息数据库中的综合教师任务列表进行匹配,确定了与"高等教育"教学或行政职业相关的任务。
此外,我们还补充了22名东北大学早期采用AI的教职员工的调查数据和定性研究,以阐明教育者的动机、担忧和使用模式。
教师AI应用的主要领域
根据我们的Claude.ai分析和与东北大学的定性研究,最突出的AI应用是课程开发。Claude.ai分析还显示学术研究和评估学生表现是第二和第三最常见的用途。
在东北大学教师的调查中,另一个常见案例是使用AI进行自身学习(平均占他们AI使用时间的29%)。然而,由于筛选机制和在这些学习实例中区分学生和教师使用的困难,这一点在我们的Claude.ai分析中未进行研究。
其他在Claude.ai数据中发现的一些特别有趣的用途包括:
- 为教育模拟创建模拟法律场景;
- 开发职业教育和劳动力培训内容;
- 为学术或专业申请起草推荐信;
- 创建会议议程和相关行政文件。
教师采用AI的动机
东北大学教师的定性研究揭示了教育者为何倾向于这些常见的AI用途:
- 自动化繁琐任务("它处理繁琐的任务";帮助"筹款的机械部分");
- 协作思维伙伴("AI能找到向学生解释概念的有效方法,这些方法我自己没想到");
- 学生个性化学习体验("AI对于给学生和我提供个性化、互动的学习体验很有用,这超出了单个教师所能提供的范围")。
教师如何利用AI构建定制工具
最鼓舞人心的发现之一是教师如何利用Claude的Artifacts功能创建互动教育材料。他们不仅仅是进行对话,而是在构建完整的、功能性资源,在某些情况下可以立即在课堂中部署。
创新型教育工具开发
教师们利用AI创建的关键工具包括:
互动教育游戏:基于网页的游戏,包括逃脱室、平台游戏和通过各种学科和级别教授概念的模拟。
评估和评估工具:带有自动反馈系统的HTML测验、用于分析学生表现的CSV数据处理器和全面的评分标准。
数据可视化:互动展示,帮助学生可视化从历史时间线到科学概念的一切内容。
学科特定学习工具:专业资源,如化学计量学游戏、带有自动反馈的遗传学测验和计算物理模型。
学术日历和调度工具:可自动填充、下载为图像或导出为PDF的互动日历,用于显示课时、考试时间、专业发展会议和机构活动。
预算规划分析工具:具有特定支出类别、成本分配和预算管理工具的教育机构预算文件。
学术文档:会议纪要、成绩相关沟通和学术诚信问题的电子邮件、教师奖项推荐信、任期上诉、资助申请、面试邀请和委员会任命。
从对话助手到创意合作者
这不仅仅局限于Claude。一位教授描述了新的AI工具如何使他们能够"将自己的内容转化为更易访问/引人入胜的形式(互动页面、模拟、播客、视频)"。
这些创作代表了从AI作为对话助手到AI作为创意合作者的转变,使教育者能够生产传统上需要大量专业技术或资源的个性化教育材料。
教育任务的增强与自动化光谱
我们的分析揭示了教育者如何平衡AI增强(协作使用)与自动化(完全委托任务)的细微差别,这建立在Anthropic先前关于经济指数的工作基础上。
Claude.ai对话中涉及增强(AI与用户协作执行任务)与自动化(AI直接执行任务)的教育工作者对话百分比,针对特定任务类别。
不同教育任务中出现了关键模式:
增强倾向较高的任务:
- 大学教学和课堂教学,包括创建教育材料和练习题(77.4%增强);
- 撰写资助提案以获得外部研究资金(70.0%增强);
- 学术指导和组织学生指导(67.5%增强);
- 监督学生学术工作(66.9%增强)。
自动化倾向相对较高的任务:
- 管理教育机构财务和筹款(65.0%自动化);
- 维护学生记录和评估学术表现(48.9%自动化);
- 管理学术招生和入学(44.7%自动化)。
这种变化表明,教育者完全委托给AI的可能性取决于任务类型。与调查结果一致,我们看到涉及常规行政和财务管理的任务比接近直接学生互动的任务(如创建练习材料或指导博士级学术研究)更可能被完全委托。这些AI交互通常需要大量上下文,因此需要AI和教授之间的协作。例如,一位东北大学教授指出,在设计课程计划时,"AI需要关于材料级别和我们已经涵盖内容的指导。"
教育者也更可能在工作需要创造力或复杂决策时以增强方式使用AI,例如撰写资助提案。在头脑风暴时,一位受访教授写道:
"与LLM的对话是有价值的,而不是第一个回应。这也是我尝试教学生的。把它当作思维伙伴,而不是思维替代品。"
尽管如此,48.9%的评分相关对话被识别为高度自动化仍然令人担忧。虽然受访教授认为这是AI效果最差的单一任务,但在Claude.ai数据中确实看到了这种情况。即使这仅占我们研究的Claude.ai对话的7%,它 emerged 作为自动化程度第二高的任务。这包括提供对学生作业反馈和使用评分标准评分工作等子任务。虽然尚不清楚这些AI生成的响应在最终成绩和反馈中占多大比例,但我们的研究确实显示了一定程度的委托给Claude。
在评分中使用AI仍然是教育者之间有争议的问题。一位东北大学教授分享道:"在伦理和实践中,我对以任何方式使用[AI工具]评估或建议学生非常谨慎。部分原因是准确性问题。我尝试了一些实验,让LLM评分论文,它们对我来说还不够好。而且在伦理上,学生不是为LLM的时间支付学费,他们是为我的时间付费。我有道德义务做好工作(也许在LLM的帮助下)。"
虽然AI反馈可以通过自动系统提供形成性反馈来支持学生的发展,但大多数教育者似乎都认同评分不应接近完全自动化。
教师如何重新思考教学内容
许多教育者认识到AI工具正在改变学生的学习方式。这反过来又给教育者改变教学方式带来了压力。正如一位受访教授所说:
"AI迫使我彻底改变我的教学方式。我正在付出大量努力试图如何应对认知卸载问题。"
它也在改变教授教授的内容。例如,在编码方面,根据一位教授的说法,"基于AI的编码完全改变了分析教学/学习体验。我们可以花时间讨论分析在商业应用中的概念,而不是调试逗号和分号。"
更广泛地说,评估AI生成内容的准确性变得越来越重要。一位教授写道:"挑战在于随着AI生成量的增加,人类验证和保持领先变得越来越不堪重负。"教授们渴望帮助学生在特定领域建立足够的专业知识,以做出这种判断。
评估也开始呈现出不同的面貌。虽然学生作弊和认知卸载仍然是一个问题,但一些教育者正在重新思考他们的评估方式。
"如果Claude或类似的AI工具可以完成一项作业,我不担心学生作弊;我[担心]我们没有作为教育者做好自己的工作。"
在一位特定的东北大学教授的案例中,他们分享说,在太多学生提交AI撰写的作业后,他们"再也不会布置传统的研究论文"。相反,他们分享说:"我将重新设计作业,使它下次无法用AI完成。我有一个学生抱怨每周作业很难做,他们很恼火,因为Claude和ChatGPT在完成这项工作上没用。我告诉他们这是一种赞美,我会努力听到更多学生这样说。"
前进的一条路径可能是基于这些新发现的工具提升作业水平,并期望学生解决更复杂、即使在AI辅助下仍然困难的现实世界挑战。然而,考虑到AI的持续改进,这是一个移动的目标,可能会给教育者 themselves 带来重大负担。此外,学生仍然需要独立于AI发展基础技能,以有效评估其输出。
研究局限与考量
这项研究伴随着重要的警告:
- 识别方法:我们的筛选通过分析Claude对话来推断哪些与教育者相关,仅捕获了约1.5%的高等教育电子邮件对话,限制了我们的研究范围仅限于明确与教育者相关的任务(例如创建教学大纲),并可能错过了许多其他不专门与教育者相关的教育者AI交互(例如获得帮助解释困难概念);
- 教育者范围有限:分析仅限于具有高等教育电子邮件地址的账户,排除了K-12教师;
- 早期采用者偏见:我们可能已经捕捉到那些已经对AI感到舒适的教育者,他们可能不代表更广泛教育者群体的技术准备情况或态度;
- 调查局限性:东北大学教师数据提供了定性背景,但代表了来自单一机构的有限样本,可能无法推广;
- 平台特定性:此分析专注于Claude.ai使用情况,可能无法反映其他AI平台上的模式;
- 时间限制:5月和6月的分析窗口没有捕捉整个学年中教育者AI使用的季节性变化。
未来展望
我们的发现揭示了教育者AI采用情况的复杂图景。从构建互动模拟到管理行政任务,应用的多样性显示了AI在学术功能中的存在不断扩大。
也许最令人鼓舞的是教育者如何利用AI构建有形的教育资源。从AI作为对话工具到AI作为创意伙伴的转变,可能有助于解决教育中长期存在的资源限制问题。正如一位教授所指出的,定制模拟和互动实验曾经"在时间上 prohibitively 昂贵",现在成为可能,为学生创造了更具吸引力的体验。
然而,在AI辅助评分方面仍然存在紧张关系。虽然我们数据中近一半的评分相关任务显示出自动化模式,但受访教师将此评为AI效果最差的应用。这种尝试与被视为适当之间的脱节——突显了持续努力平衡效率提升与教育质量和伦理考量的斗争。
这些发现表明,围绕教育中AI的叙述将继续与技术本身一起演变。教育者对适当AI使用的看法,特别是对于评分等敏感任务,可能会随着工具的改进和最佳实践的出现而转变。对未来研究同样重要的是理解学生和教育者AI使用如何互动——当学生知道他们的教授在使用AI时,他们如何看待和回应?教育者的采用如何影响学生的学习行为?
我们的研究捕捉了教育者在积极实验时刻的图像,在构建新可能性的同时,也在思考他们在AI增强课堂中的基本作用。前进的道路将需要持续的对话、谨慎的政策制定和持续的研究,以确保这些工具增强而非损害教育体验。