AI社区笔记:X平台内容审核的福音还是潘多拉魔盒?

1

AI社区笔记:X平台内容审核的双刃剑

埃隆·马斯克的X平台(前身为Twitter)一直试图通过“社区笔记”功能革新社交媒体的事实核查机制。这个系统旨在通过众包方式,汇集不同观点,判断X平台上信息的可靠性。然而,X平台计划引入人工智能(AI)来辅助撰写社区笔记,这无疑是一把双刃剑,可能动摇用户对这一事实核查系统的信任。

AI驱动的社区笔记:理想与现实的差距

X平台在一份研究报告中,将这一举措描述为一次“升级”,但同时也坦诚地列出了AI写作可能带来的各种问题。理想情况下,AI代理可以加速并扩大社区笔记的覆盖范围,从而提升平台整体的事实核查效率。每一条AI生成的笔记都会经过人工审核,形成一个反馈循环,不断提升AI的写作能力。随着AI的进步,人工审核员可以将精力放在更复杂、更微妙的事实核查任务上,例如需要专业知识或社会意识的帖子。X平台认为,如果一切顺利,这种人机协作模式不仅能改变X平台的事实核查方式,还能为“公共知识生产领域的人工智能协作”提供新的蓝图。

AI快讯

然而,一个关键问题是:AI生成的笔记是否能像人工撰写的那样准确?更令人担忧的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI“在撰写具有说服力、情感共鸣且看似中立的笔记方面异常出色”,人工审核员可能会误认为这些笔记是有帮助的。这将扰乱反馈循环,削弱社区笔记的质量,并长期降低整个系统的可信度。X平台的研究报告警告说:“如果帮助性评分与准确性并非完全相关,那么经过精心润色但具有误导性的笔记可能更容易通过批准门槛。”

AI的潜在风险:操纵与滥用

随着大型语言模型(LLM)的不断发展,这种风险可能会加剧。LLM不仅能写出更具说服力的内容,还能更容易地研究和构建看似可靠的证据,从而支持几乎任何主张,无论其真实性如何,这使得人工审核员更难发现其中的欺骗或错误。

X平台的AI计划已经引来了诸多批评。英国前技术部长达米安·柯林斯指责X平台正在构建一个可能“大规模操纵人们在平台上的所见和信任”的系统。他认为,AI笔记可能会增加X平台上“谎言和阴谋论”的传播。艾伦·图灵研究所新兴技术与安全中心的 исследовательский 助理塞缪尔·斯托克韦尔也表示,X平台的成功很大程度上取决于其“针对AI‘笔记作者’可能产生幻觉并在其输出中放大错误信息的风险而采取的保障措施的质量”。

斯托克韦尔指出:“AI聊天机器人通常难以处理细微差别和语境,但擅长自信地提供听起来很有说服力的答案,即使这些答案是不真实的。如果平台不能有效地解决这个问题,这可能是一个危险的组合。”

社区笔记的未来:挑战与机遇

另一个复杂因素是:任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他代理更具偏见或缺陷。如果出现这种情况,X平台预测,人工作者可能会厌倦撰写笔记,从而威胁到社区笔记最初赖以建立的多元化观点。

对于那些坚持下来的人工作者和审核员来说,大量的AI生成笔记可能会让他们不堪重负。英国事实核查组织Full Fact的AI负责人安迪·达德菲尔德表示,X平台面临的风险是“增加人工审核员的负担,让他们需要检查更多的草稿笔记,从而可能导致笔记完全由AI起草、审查和发布,而缺乏人工输入带来的仔细考量。”

X平台计划进行更多研究,以确保“人工评分能力能够充分扩展”,但如果无法解决这个问题,那么“最关键的笔记的影响”可能会被稀释。研究人员指出,一个可能的解决方案是取消人工审核流程,并将AI生成的笔记应用于人工评分员先前批准的“类似语境”中。但这样做最大的潜在缺陷是显而易见的。

X平台承认:“自动将笔记与人们认为不需要笔记的帖子相匹配,可能会严重损害对该系统的信任。”最终,研究人员承认,X平台上的AI笔记作者可能被认为是一个“错误的”工具,但他们仍将继续进行测试以找出答案。

AI笔记的发布与测试

X平台的社区笔记帐户表示,所有AI生成的社区笔记都将“明确标记给用户”。第一批AI笔记只会出现在用户请求添加笔记的帖子中,但最终AI笔记作者可能会被允许选择帖子进行事实核查。更多细节将在本月晚些时候AI生成的笔记开始出现在X平台上时公布,但与此同时,X用户可以开始测试AI笔记作者,并很快被考虑纳入AI代理的初始队列。(如果任何Ars读者最终测试了AI笔记作者,这位Ars作者很想了解更多关于您的体验。)

为了进行研究,X平台与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的博士后、研究人员和教授合作,研究诸如人类对AI的信任、微调AI和AI安全等主题。研究人员一致认为,“在某些情况下”,AI代理可以“在时间和精力方面以一小部分成本生成与人类撰写的笔记质量相似的笔记”。他们认为,需要进行更多研究,以克服已标记的风险,从而获得“变革性机遇”的益处,这种机遇“有望大幅提高X平台事实核查的规模和速度”。

该论文称,如果AI笔记作者“生成的初始草案比单个作者通常能代表的范围更广,那么从一开始就能提高社区审议的质量”。

AI笔记的未来展望

研究人员设想,一旦X平台的测试完成,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预测会迅速传播的帖子,并阻止错误信息比人工审核员更快地传播。

他们认为,这种自动化系统的其他好处包括X笔记评分员可以快速访问更彻底的研究和证据综合,以及更清晰的笔记组成,从而加快评分过程。

研究人员推测,也许有一天,AI代理甚至可以学习预测评分,以加快速度。然而,需要进行更多研究,以确保这不会使社区笔记同质化,以至于没有人阅读它们。

该论文中提出的最具马斯克风格的想法也许是训练具有冲突观点的AI笔记作者“对笔记的优点进行对抗性辩论”。据说,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人类评分员能够做出更明智的判断”。

该论文称:“评分员不再从头开始,而是扮演仲裁者的角色——评估结构化的论点冲突。”

虽然X平台可能正在采取行动来减少X用户撰写社区笔记的工作量,但研究人员清楚地表明,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行橡皮图章式的批准。

该论文称,从头开始撰写的人工笔记对于训练AI代理很有价值,而且一些评分员的专业知识不易复制。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能撰写“关于自动化作者忽略的主题”的笔记,例如垃圾邮件或诈骗。