X平台AI社区笔记:效率提升还是信任危机?

1

在数字信息时代,社交媒体平台X(前身为Twitter)正尝试利用人工智能(AI)来革新其社区笔记功能。社区笔记旨在通过众包方式,对平台上发布的信息进行事实核查,以此提升信息的可信度。然而,将AI引入社区笔记的做法,既带来了机遇,也潜藏着巨大的风险。

AI驱动的社区笔记:理想与现实的差距

X设想的理想状态是,AI能够加速并扩大社区笔记的覆盖范围,从而更迅速地识别和纠正不准确的信息。AI撰写的每条笔记都将由人工审核员进行评估,通过反馈循环不断提升AI的写作能力。这样一来,人工审核员便可以将精力集中在需要专业知识或社会意识的复杂案例上。X的研究报告指出,如果一切顺利,这种人机协作模式不仅能改变X平台的事实核查方式,还能为公共知识的生产提供新的蓝图。

AI快讯

然而,现实情况可能远不如X所期望的那样乐观。一个关键问题是,AI撰写的笔记是否能像人工撰写的笔记一样准确?更令人担忧的是,AI可能会生成“具有说服力但不准确的笔记”,由于AI在情感表达和中立性方面的出色能力,这些笔记可能会被误认为是有用的。这种现象可能会扰乱反馈循环,降低社区笔记的整体质量,并最终削弱用户对该系统的信任。

潜在的风险:误导性信息与工业级操纵

X的这份研究报告警告说,如果笔记的“有用性”与“准确性”之间没有完美的关联,那么精心包装但具有误导性的笔记更有可能通过审核。随着大型语言模型(LLM)的不断发展,这种风险可能会进一步加剧。LLM不仅能写出更具说服力的内容,还能更容易地研究和构建看似可靠的证据,从而使人工审核员更难发现其中的欺骗或错误。

X的AI计划已经引发了广泛的批评。英国前技术大臣达米安·柯林斯指责X正在构建一个可能被用于大规模操纵用户认知和信任的系统。他认为,AI笔记可能会增加X平台上“谎言和阴谋论”的传播。艾伦·图灵研究所新兴技术与安全中心的研究员塞缪尔·斯托克韦尔也表达了类似的担忧,他认为X的成功在很大程度上取决于其采取的保障措施,以防止AI“笔记作者”产生幻觉并放大错误信息。

斯托克韦尔警告说,AI聊天机器人通常难以把握细微差别和语境,但却擅长自信地提供听起来很有说服力的答案,即使这些答案是不真实的。“如果平台不能有效地解决这个问题,这可能是一个危险的组合。”

社区笔记的未来:机遇与挑战并存

更复杂的是,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着不同的AI代理可能存在不同程度的偏见或缺陷。如果这种情况发生,人工撰写者可能会对撰写笔记失去兴趣,从而威胁到社区笔记最初赖以建立的多样化观点。

此外,即使人工撰写者和审核员继续参与,大量的AI撰写笔记也可能会使他们不堪重负。英国事实核查组织Full Fact的AI主管安迪·达德菲尔德表示,X可能面临“增加人工审核员负担”的风险,最终导致笔记的起草、审核和发布完全由AI完成,而缺乏人工输入的仔细考量。

X计划进行更多的研究,以确保“人工评估能力能够充分扩展”,但如果无法解决这个问题,那么“最关键的笔记的影响”可能会被削弱。研究人员提出的一个可能的解决方案是,取消人工审核流程,并将AI撰写的笔记应用于人工评估员先前批准的“类似语境”中。然而,这种做法的最大潜在缺陷是显而易见的。

X的研究报告承认,“自动将笔记匹配到人们认为不需要它们的帖子可能会严重损害对系统的信任。”最终,AI笔记作者可能被认为是“错误的”工具,但X仍在继续进行测试,以找出答案。

AI笔记的部署与未来展望

X的社区笔记账户表示,所有AI撰写的社区笔记都将“为用户明确标记”。最初,AI笔记只会出现在用户请求添加笔记的帖子上,但最终AI笔记作者可能会被允许选择帖子进行事实核查。

更多细节将在本月晚些时候AI撰写的笔记开始出现在X上时公布。与此同时,X用户可以开始测试AI笔记作者,并很快被考虑纳入AI代理的初始队列。X与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的研究生、研究人员和教授合作,研究了诸如人类对AI的信任、微调AI和AI安全等主题。

研究人员一致认为,“在某些情况下”,AI代理可以“以比人工撰写笔记更少的时间和精力生成质量相似的笔记”。他们认为,需要进行更多的研究,以克服已标记的风险,从而获得“变革性机遇”带来的好处,这种机遇“有望显着提高X平台事实核查的规模和速度”。

该论文指出,如果AI笔记作者“生成比单个人工撰写者通常更广泛的观点范围的初始草案,那么社区审议的质量从一开始就会得到提高”。研究人员设想,一旦X的测试完成,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预测会传播开来的帖子,并阻止错误信息传播的速度超过人工审核员。

他们认为,这种自动化系统的其他好处包括X笔记评估者可以快速访问更彻底的研究和证据综合,以及更清晰的笔记撰写,从而加快评估过程。研究人员推测,也许有一天,AI代理甚至可以学习预测评估分数,以进一步加快速度。然而,需要进行更多的研究,以确保这不会使社区笔记同质化,使其变得平淡无奇,以至于没有人阅读它们。

该论文中提出的最具马斯克风格的想法是,训练具有冲突观点的AI笔记作者“以对抗方式辩论笔记的优点”。据称,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评估者能够做出更明智的判断”。该论文称,“评估者现在不是从头开始,而是扮演仲裁者的角色——评估有条理的论点冲突。”

研究人员表示,虽然X可能正在努力减少X用户撰写社区笔记的工作量,但很明显,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行橡皮图章式的批准,而且“从头开始撰写”的人工笔记对于训练AI代理非常有价值,并且一些评估者的专业知识不容易被复制。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能被迫撰写“自动化作者忽略的主题”的笔记,例如垃圾邮件或诈骗。

总而言之,X平台引入AI社区笔记是一项复杂且具有风险的举措。尽管AI有望提高事实核查的效率和覆盖范围,但也可能导致误导性信息的传播和用户信任的降低。X需要在技术创新和风险控制之间找到平衡,以确保AI社区笔记能够真正提升平台的信息质量和用户体验。