X平台AI社区笔记:效率飞跃还是信任危机?深度剖析潜在风险与挑战

1

AI社区笔记:X平台的“危险组合”?

埃隆·马斯克的X平台(原Twitter)通过推出“社区笔记”功能,在社交媒体的事实核查领域掀起了一场变革。该系统通过众包的方式,汇集不同观点,以判断X平台上的帖子是否可信。然而,现在X平台计划允许人工智能(AI)参与撰写社区笔记,这可能会破坏用户对该事实核查系统的信任。

AI社区笔记的构想与风险

X平台在一份研究报告中,将这一举措描述为“升级”,同时也坦承了AI撰写社区笔记可能带来的潜在风险。理想情况下,AI代理可以加速并增加添加到不准确帖子上的社区笔记数量,从而加强整个平台的事实核查工作。每条由AI撰写的笔记都将由人工审核员进行评估,提供反馈,使AI代理在笔记撰写方面变得更加出色。随着AI代理在撰写笔记方面的进步,人工审核员可以将精力集中在更细致的事实核查上,例如需要专业知识或社会意识的帖子。

AI快讯

然而,一个关键问题仍然存在:X平台并不确定AI撰写的笔记是否能像人工撰写的笔记一样准确。更复杂的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI“非常擅长撰写有说服力、情感共鸣且看似中立的笔记”,人工评估员可能会将其评为有帮助。这可能会扰乱反馈循环,削弱社区笔记的质量,并随着时间的推移降低整个系统的可信度。

报告指出:“如果评分的有用性与准确性并非完全相关,那么经过高度润色但具有误导性的笔记可能更容易通过批准阈值。随着大型语言模型(LLM)的进步,这种风险可能会增加;它们不仅可以 persuasive 地写作,还可以更轻松地研究和构建看似健全的证据体系来支持几乎任何主张,无论其真实性如何,从而使人工评估员更难发现欺骗或错误。”

专家质疑与担忧

X平台的AI计划已经面临批评。前英国技术部长Damian Collins指责X平台正在构建一个系统,该系统可能导致“对人们在拥有超过6亿用户的平台上看到和决定信任的内容进行工业化操纵”。Collins声称,AI笔记可能会增加X平台上“谎言和阴谋论”的传播,而他并不是唯一发出警报的专家。

艾伦·图灵研究所新兴技术与安全中心的助理研究员Samuel Stockwell表示,X平台的成功很大程度上取决于“X平台为防范这些AI‘笔记撰写者’可能在其输出中产生幻觉和放大错误信息风险而采取的保障措施的质量”。

Stockwell表示:“AI聊天机器人通常难以处理细微差别和语境,但擅长自信地提供听起来 persuasive 的答案,即使这些答案不真实。如果平台不能有效解决这个问题,这可能是一个危险的组合。”

AI社区笔记的潜在问题

X平台的社区笔记账户解释说,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他代理更具偏见或存在缺陷。如果出现这种情况,X平台预测,人工撰写者可能会厌倦撰写笔记,从而威胁到使社区笔记如此值得信赖的观点多样性。

AI快讯

对于那些坚持下来的人工撰写者和评估员来说,大量的AI撰写笔记可能会使他们不堪重负。英国事实核查组织Full Fact的AI负责人Andy Dudfield表示,X平台可能会“增加人工评估员检查更多草稿笔记的负担,从而开启一种令人担忧且看似合理的情况,即笔记可能完全由AI起草、审查和发布,而无需人工输入的仔细考虑”。

X平台计划进行更多研究,以确保“人工评估能力能够充分扩展”,但如果它无法解决这个难题,它知道“最关键的笔记的影响”可能会被削弱。研究人员指出,解决这个“瓶颈”的一个可能方案是取消人工审核过程,并在人工评估员先前批准的“类似语境”中应用AI撰写的笔记。但这样做的最大潜在缺陷是显而易见的。

X平台的报告承认:“自动将笔记匹配到人们认为不需要它们的帖子可能会严重损害对系统的信任。”最终,研究人员承认,X平台上的AI笔记撰写者可能被视为一种“错误的”工具,但他们将继续进行测试以找出答案。

AI笔记的发布与未来

X平台的社区笔记账户表示,所有AI撰写的社区笔记都将“为用户明确标记”。第一批AI笔记将仅出现在人们已请求添加笔记的帖子上,但最终AI笔记撰写者可能会被允许选择帖子进行事实核查。

当AI撰写的笔记在本月晚些时候开始出现在X平台上时,将会揭示更多信息,但与此同时,X平台用户可以开始测试AI笔记撰写者,并很快被考虑纳入AI代理的初始队列。(如果任何Ars读者最终测试了AI笔记撰写者,这位Ars作者很想了解更多关于您的体验。)

为了进行研究,X平台与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的研究生、研究人员和教授合作,调查人类对AI的信任、微调AI和AI安全等主题。研究人员一致认为,“在某些情况下”,AI代理可以“以人工撰写笔记类似的质量生成笔记——而且所需的时间和精力仅为人工撰写的一小部分”。他们建议,需要进行更多研究,以克服已标记的风险,从而获得“变革性机遇”的好处,这种机遇“有望大幅提高X平台事实核查的规模和速度”。

该报告称,如果AI笔记撰写者“生成比单个人工撰写者通常能代表的更广泛的视角,那么从一开始就可以提高社区审议的质量”。研究人员设想,一旦X平台的测试完成,AI笔记撰写者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预计会走红的帖子,并阻止错误信息比人工评估员更快地传播。

他们建议,该自动化系统的其他好处包括X平台笔记评估员可以快速访问更全面的研究和证据综合,以及更清晰的笔记组成,这可以加快评估过程。研究人员推测,也许有一天,AI代理甚至可以学习预测评分,以进一步加快速度。但是,需要进行更多研究以确保这不会使社区笔记同质化,以至于没有人阅读它们。

该论文中提出的最具马斯克风格的想法也许是训练具有冲突观点的AI笔记撰写者“以对抗方式辩论笔记的优点”。据推测,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评估员能够做出更明智的判断”。该论文称:“评估员现在不是从头开始,而是扮演仲裁者的角色——评估有组织的论点冲突。”

人工审核员的重要性

虽然X平台可能正在采取措施减少X平台用户撰写社区笔记的工作量,但研究人员清楚地表明,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行橡皮图章式的批准,而且“从头开始撰写”的人工笔记对于训练AI代理非常有价值,并且某些评估员的专业知识无法轻易复制。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能被迫撰写“关于自动化撰写者忽略的主题”的笔记,例如垃圾邮件或诈骗。

结论

X平台引入AI撰写社区笔记是一项大胆的尝试,旨在提高事实核查的效率和覆盖面。然而,这一举措也伴随着诸多风险,包括AI可能生成具有说服力但不准确的笔记、加剧错误信息的传播、以及对人工审核员造成过重负担。X平台需要认真评估这些风险,并采取有效措施来确保AI社区笔记的准确性和可信度。只有这样,才能充分发挥AI在事实核查方面的潜力,同时避免其潜在的负面影响。