X平台AI社区笔记:效率提升还是信任危机?

1

AI社区笔记:X平台的双刃剑?

埃隆·马斯克的X平台(前身为Twitter)通过推出“社区笔记”功能,在社交媒体的事实核查领域掀起了一场革命。该系统旨在通过众包的方式,汇集不同观点,以判断X平台上的帖子是否可信。然而,X平台计划允许人工智能(AI)参与撰写社区笔记,这可能会破坏用户对该事实核查系统的信任。

在一份研究报告中,X平台将这一举措描述为“升级”,同时也详细阐述了AI撰写社区笔记可能带来的问题。理想情况下,AI代理可以加速并增加添加到不准确帖子上的社区笔记数量,从而扩大平台范围内的事实核查工作。每条AI撰写的笔记都将由人工审核员进行评估,提供反馈,使AI代理在笔记撰写方面表现更好。随着AI代理在撰写笔记方面越来越出色,人工审核员可以将精力集中在AI无法快速解决的细微事实核查上,例如需要专业知识或社会意识的帖子。如果一切顺利,人工和AI审核员的合作不仅可以改变X平台的事实核查方式,还可以为“人机协作生产公共知识的新形式”提供蓝图。

AI快讯

然而,关键问题仍然存在:X平台不确定AI撰写的笔记是否与人工撰写的笔记一样准确。更复杂的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI“非常擅长撰写具有说服力、情感共鸣且看似中立的笔记”,因此人工评估员可能会将其评为有帮助。这可能会扰乱反馈循环,削弱社区笔记,并随着时间的推移降低整个系统的可信度。X平台的研究报告警告说:“如果评分的帮助性与准确性并非完全相关,那么经过高度润色但具有误导性的笔记可能更容易通过批准阈值。”

报告还指出:“随着大型语言模型(LLM)的进步,这种风险可能会增加;它们不仅可以有说服力地写作,还可以更轻松地研究和构建看似强大的证据体系来支持几乎任何主张,无论其真实性如何,从而使人工评估员更难发现欺骗或错误。”

X平台的AI计划已经面临批评。英国前技术部长达米安·柯林斯指责X平台正在构建一个系统,该系统可能允许“对人们在拥有超过6亿用户的平台上看到和决定信任的内容进行工业化操纵”。柯林斯声称,AI笔记有可能增加X平台上“谎言和阴谋论”的传播。艾伦·图灵研究所新兴技术和安全中心的研究员塞缪尔·斯托克韦尔表示,X平台的成功很大程度上取决于“X平台采取的保障措施的质量,以防止这些AI‘笔记作者’产生幻觉并在其输出中放大错误信息的风险”。

斯托克韦尔说:“AI聊天机器人通常难以处理细微之处和背景,但擅长自信地提供听起来有说服力的答案,即使这些答案不真实。如果平台不能有效地解决这个问题,这可能是一个危险的组合。”

此外,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他AI代理更具偏见或缺陷。如果这种反乌托邦式的事件发生,X平台预测人工作者可能会厌倦撰写笔记,从而威胁到使社区笔记如此值得信赖的观点多样性。

对于任何坚持下来的人工作者和审核员来说,大量的AI撰写笔记可能会使他们不堪重负。英国事实核查组织Full Fact的AI负责人安迪·达德菲尔德表示,X平台面临的风险是“增加人工审核员的负担,使他们需要检查更多的草稿笔记,从而可能导致一种令人担忧且看似合理的情况,即笔记可能完全由AI起草、审核和发布,而没有人工输入提供的仔细考虑。”

X平台计划进行更多研究,以确保“人工评估能力能够充分扩展”,但如果它无法解决这个难题,它知道“最关键的笔记的影响”可能会被削弱。

研究人员指出,解决这个“瓶颈”的一种可能方法是取消人工审核流程,并在人工评估员先前批准的“类似情况”中应用AI撰写的笔记。但这里最大的潜在缺陷是显而易见的。“自动将笔记与人们认为不需要它们的帖子进行匹配可能会大大损害对系统的信任,”X平台的报告承认。

研究人员承认,最终,X平台上的AI笔记作者可能被认为是“错误的”工具,但他们将继续进行测试以找出答案。

AI撰写的笔记将于本月开始发布

X平台的社区笔记帐户表示,所有AI撰写的社区笔记“都将为用户清楚地标记”。该帐户表示,第一批AI笔记只会出现在人们要求提供笔记的帖子上,但最终可能会允许AI笔记作者选择帖子进行事实核查。

当AI撰写的笔记在本月晚些时候开始出现在X平台上时,将会有更多信息披露,但与此同时,X平台用户可以开始测试AI笔记作者,并很快被考虑加入AI代理的初始队列。(如果任何读者最终测试了AI笔记作者,这位作者很想了解更多关于您的体验。)

为了进行研究,X平台与研究生、研究助理以及在哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学研究AI中的人类信任、微调AI和AI安全等主题的教授合作。

研究人员一致认为,“在某些情况下”,AI代理可以“在时间和精力的一小部分内生成与人工撰写笔记质量相似的笔记”。他们建议需要进行更多研究,以克服已标记的风险,从而获得“变革性机会”的好处,该机会“有望显着提高X平台事实核查的规模和速度”。

该论文称,如果AI笔记作者“生成的初始草稿比单个人工作者通常能代表的更广泛的观点,那么从一开始就提高了社区审议的质量”。

AI笔记的未来

研究人员设想,一旦X平台的测试完成,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预测会传播开来的帖子,并阻止错误信息的传播速度超过人工审核员的速度。

他们建议,这种自动化系统的其他好处包括X平台笔记评估员可以快速访问更彻底的研究和证据合成,以及更清晰的笔记组成,这可以加快评估过程。

研究人员推测,也许有一天,AI代理甚至可以学习预测评分以加快速度。但是,需要进行更多研究以确保这不会使社区笔记同质化,从而使没有人阅读它们。

该论文中提出的最具马斯克式的想法是,训练具有冲突观点的AI笔记作者“以对抗方式辩论笔记的优点”。据推测,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评估员能够做出更明智的判断”。

该论文称:“评估员现在扮演着裁判的角色,而不是从头开始,而是评估结构化的论点冲突。”

研究人员表示,虽然X平台可能会减少X平台用户撰写社区笔记的工作量,但很明显,AI永远无法取代人类。这些人对于不仅仅是批准AI撰写的笔记是必要的。

该论文称,从头开始撰写的人工笔记对于训练AI代理很有价值,并且一些评估员的专业知识不容易复制。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更可能被驱使撰写“自动作者忽略的主题”的笔记,例如垃圾邮件或诈骗。

AI快讯