X平台AI社区笔记:效率提升还是信任危机?AI事实核查的双刃剑

1

在数字信息爆炸的时代,社交媒体平台X(前身为Twitter)正面临着前所未有的挑战。如何有效甄别和纠正平台上泛滥的虚假信息,成为维护信息生态健康的关键。X平台最初通过引入“社区笔记”功能,尝试利用众包模式来实现这一目标,即通过用户群体的智慧来评估和标注帖子的可信度。这一举措在一定程度上被视为社交媒体事实核查的一次创新。

然而,X平台最近提出的一项计划却引发了广泛的争议和担忧:利用人工智能(AI)来生成社区笔记。尽管X平台声称这一举措旨在提升事实核查的效率和覆盖面,但许多专家和用户担心,这可能会适得其反,削弱社区笔记系统的可信度,甚至加剧虚假信息的传播。

AI快讯

X平台在一份研究报告中详细阐述了其AI社区笔记的计划,并坦诚地承认了其中可能存在的风险。按照X平台的设想,AI代理将能够快速生成大量的社区笔记,从而加速对不准确帖子的标注。这些AI生成的笔记将由人工审核员进行评估,通过反馈循环不断提升AI的写作能力。随着AI在撰写笔记方面的能力提升,人工审核员可以将精力集中在更复杂、更需要专业知识或社会意识的事实核查上。

X平台认为,如果一切顺利,这种人机协作模式不仅可以改变X平台的事实核查方式,还可以为公共知识的生产提供一种新的蓝图。然而,现实情况远比理想化模型复杂。一个关键问题是,AI撰写的笔记是否能像人工撰写的笔记一样准确?更令人担忧的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI擅长“撰写具有说服力、情感共鸣且看似中立的笔记”,人工审核员可能会将这些笔记评为“有帮助”。这将扰乱反馈循环,降低社区笔记的质量,并随着时间的推移削弱整个系统的可信度。

X平台的研究报告警告说:“如果‘有帮助’的评分与准确性并非完全相关,那么经过精心润色但具有误导性的笔记可能更容易通过批准阈值。”“随着大型语言模型(LLM)的进步,这种风险可能会增加;它们不仅可以写得更有说服力,还可以更容易地研究和构建看似可靠的证据,从而支持几乎任何主张,无论其真实性如何,这使得人工审核员更难发现欺骗或错误。”

X平台的AI计划已经面临着来自各方的批评。英国前技术部长达米安·柯林斯指责X平台正在构建一个可能导致“对人们在拥有超过6亿用户的平台上看到和决定信任的内容进行工业化操纵”的系统。《卫报》报道称,柯林斯声称AI笔记可能会增加X平台上“谎言和阴谋论”的传播,而他并不是唯一发出警告的专家。

艾伦·图灵研究所新兴技术与安全中心的 Samuel Stockwell 告诉《卫报》,X平台的成功很大程度上取决于“X平台采取的保障措施的质量,以防止这些 AI ‘笔记作者’ 产生幻觉并在其输出中放大错误信息。”

Stockwell 说:“AI 聊天机器人通常难以处理细微之处和上下文,但擅长自信地提供听起来有说服力的答案,即使这些答案是不真实的。”“如果平台没有有效地解决这个问题,这可能是一个危险的组合。”

更复杂的是,X平台的社区笔记帐户解释说,任何人都可以使用任何技术创建 AI 代理来编写社区笔记。这意味着某些 AI 代理可能比其他 AI 代理更具偏见或缺陷。如果这种反乌托邦式的版本发生,X平台预测人工作者可能会厌倦编写笔记,从而威胁到使社区笔记如此值得信赖的观点多样性。

对于任何坚持下来的人工作者和审阅者来说,大量的 AI 编写的笔记可能会让他们不堪重负。英国事实核查组织 Full Fact 的 AI 主管 Andy Dudfield 告诉《卫报》,X平台面临着“增加人工审阅者检查更多笔记草案的沉重负担的风险,从而打开了一个令人担忧和看似合理的情况,在这种情况下,笔记可能完全由 AI 起草、审阅和发布,而没有人工输入提供的仔细考虑。”

X平台正计划进行更多研究,以确保“人工评级能力能够充分扩展”,但如果它无法解决这个难题,它知道“最关键的笔记的影响”可能会被稀释。研究人员指出,解决这个“瓶颈”的一个可能方法是取消人工审核过程,并在人工评估人员先前批准的“类似情况”中应用 AI 编写的笔记。但那里最大的潜在缺陷是显而易见的。

X平台的论文承认:“自动将笔记与人们认为不需要它们的帖子进行匹配可能会严重损害对系统的信任。”最终,X平台上的 AI 笔记编写者可能被认为是“错误的”工具,研究人员承认,但他们正在继续进行测试以找出答案。

所有 AI 编写的社区笔记“都将为用户清楚地标明”,X平台的社区笔记帐户说。该帐户表示,第一批 AI 笔记只会出现在人们要求提供笔记的帖子上,但最终可能会允许 AI 笔记编写者选择帖子进行事实核查。当 AI 编写的笔记在本月晚些时候开始出现在 X平台上时,将会透露更多信息,但与此同时,X平台用户可以立即开始测试 AI 笔记编写者,并很快被考虑纳入 AI 代理的初始队列。(如果任何 Ars 的读者最终测试了 AI 笔记编写者,这位 Ars 的作者会很想了解更多关于您的体验。)

为了进行研究,X平台与研究生、研究助理和教授合作,调查了哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的人工信任 AI、微调 AI 和 AI 安全等主题。研究人员一致认为,“在某些情况下”,AI 代理可以“在时间和精力上以一小部分成本生成与人工编写的笔记质量相似的笔记”。他们建议需要进行更多研究,以克服已标记的风险,从而获得“变革性机遇”的好处,这种机遇“有望显着提高 X平台事实核查的规模和速度”。

该论文称,如果 AI 笔记编写者“生成比单个人工编写者通常可以提供的更广泛视角的初始草案,那么从一开始就提高了社区审议的质量”。

研究人员设想,一旦 X平台的测试完成,AI 笔记编写者不仅可以帮助研究人工用户标记的有问题的帖子,还可以有一天选择预测会传播开来的帖子,并阻止错误信息传播的速度超过人工审阅者。他们建议,这种自动化系统的其他好处包括 X平台笔记评级者可以快速访问更彻底的研究和证据综合,以及更清晰的笔记编写,这可以加快评级过程。

研究人员推测,也许有一天,AI 代理甚至可以学习预测评级分数以加快速度。但是,需要进行更多研究以确保这不会使社区笔记同质化,从而使它们变得乏味,以至于没有人阅读它们。

该论文中提出的最具马斯克式的想法可能是训练具有冲突观点的 AI 笔记编写者“以对抗方式辩论笔记的优点”。据说,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评级者能够做出更明智的判断”。

该论文称:“评级者现在不是从头开始,而是扮演仲裁者的角色 - 评估结构化的论点冲突。”研究人员表示,虽然 X平台可能会减少 X平台用户编写社区笔记的工作量,但很明显 AI 永远无法取代人类。这些人对于不仅仅是橡皮图章 AI 编写的笔记是必要的。该论文称,从头开始编写的人工笔记对于训练 AI 代理很有价值,并且某些评级者的专业知识不容易复制。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能编写“关于自动化作者忽略的主题的笔记”,例如垃圾邮件或诈骗。

总而言之,X平台在利用AI改进社区笔记功能方面面临着巨大的挑战和风险。如何在提高效率的同时,确保信息的准确性和公正性,避免AI被滥用以传播虚假信息,是X平台必须认真考虑的问题。未来的研究和实践将决定AI社区笔记最终能否成为一个有益的工具,还是会成为X平台信息生态的又一个潜在威胁。