X平台AI社区笔记:效率提升与潜在风险,一场危险的豪赌?

0

AI社区笔记:X平台的新尝试与潜在风险

埃隆·马斯克的X平台(前身为Twitter)通过引入“社区笔记”功能,在社交媒体的事实核查领域掀起了一场变革。这一系统通过众包的方式,汇集用户对X平台帖子真实性的不同观点,旨在提高信息的可信度。然而,X平台计划引入人工智能(AI)来辅助撰写社区笔记,这引发了人们对该系统可靠性的担忧。

X平台在一份研究报告中承认,尽管AI可以提升社区笔记的效率和覆盖范围,但也存在潜在的风险。理想情况下,AI代理可以加速社区笔记的生成,并扩大其在错误信息帖子中的应用,从而增强平台整体的事实核查能力。AI撰写的每条笔记都将由人工审核员进行评估,通过反馈循环不断优化AI的写作能力。随着AI代理在撰写笔记方面的能力不断提升,人工审核员可以将精力集中在需要专业知识或社会意识的复杂事实核查任务上。X平台认为,如果一切顺利,人机协作模式不仅可以改变X平台的事实核查机制,还可以为公共知识生产领域的人工智能合作提供新的蓝图。

然而,一个关键问题是,AI撰写的笔记是否能像人工撰写的笔记一样准确。更复杂的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI“擅长撰写具有说服力、情感共鸣和表面中立的笔记”,人工评估员可能会认为这些笔记有帮助。这可能会扰乱反馈循环,削弱社区笔记的质量,并随着时间的推移降低整个系统的可信度。报告中提到“如果评分的有用性与准确性并非完全相关,那么经过精心修饰但具有误导性的笔记更有可能通过批准阈值,”X平台的研究报告警告说。“随着大型语言模型(LLM)的进步,这种风险可能会增加;它们不仅能写出具有说服力的文章,还能更容易地研究和构建看似可靠的证据来支持几乎任何主张,无论其真实性如何,从而使人工评估员更难发现欺骗或错误。”

AI快讯

X平台的AI计划已经面临诸多批评。英国前技术部长达米安·柯林斯指责X平台正在构建一个可能被用于“大规模操纵人们在拥有超过6亿用户的平台上看到和信任的内容”的系统。《卫报》报道称,柯林斯声称,AI笔记可能会增加X平台上“谎言和阴谋论”的传播,而他并不是唯一对此表示担忧的专家。艾伦·图灵研究所新兴技术与安全中心的助理研究员塞缪尔·斯托克韦尔表示,X平台的成功很大程度上取决于“X平台为防范这些AI‘笔记作者’产生幻觉并在其输出中放大错误信息的风险而设置的保障措施的质量。”

斯托克韦尔表示:“AI聊天机器人通常难以处理细微之处和背景信息,但擅长自信地提供听起来有说服力的答案,即使这些答案并不真实。如果平台不能有效地解决这个问题,这可能是一个危险的组合。”

更复杂的是,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他代理更具偏见或缺陷。X平台的社区笔记账户解释说,如果这种反乌托邦式的情况发生,人工作者可能会厌倦撰写笔记,从而威胁到社区笔记 первоначальной 多样性,而这正是社区笔记 первоначальной 如此值得信赖的原因。

对于那些坚持下来的人工作者和审核员来说,大量的AI撰写笔记可能会让他们不堪重负。英国事实核查组织Full Fact的AI负责人安迪·达德菲尔德告诉《卫报》,X平台面临的风险是“增加人工审核员的负担,让他们检查更多的草稿笔记,从而打开了一扇令人担忧且看似合理的大门,在这种情况下,笔记可能完全由AI起草、审核和发布,而没有人工输入的仔细考虑。”

X平台正计划进行更多的研究,以确保“人工评估能力能够充分扩展”,但如果无法解决这个难题,那么“最关键的笔记的影响”可能会被削弱。研究人员指出,解决这个“瓶颈”的一个可能方法是取消人工审核过程,并在人工评估员之前批准的“类似情况下”应用AI撰写的笔记。但这种做法最大的潜在缺陷是显而易见的。“自动将笔记与人们认为不需要笔记的帖子进行匹配,可能会大大削弱人们对系统的信任,”X平台的报告承认。

研究人员承认,最终,X平台上的AI笔记作者可能会被认为是一种“错误的”工具,但他们将继续进行测试以找出答案。

AI撰写的笔记将于本月开始发布

X平台的社区笔记账户表示,所有AI撰写的社区笔记“都将明确地标明给用户”。该账户表示,第一批AI笔记将只出现在人们要求提供笔记的帖子中,但最终AI笔记作者可能会被允许选择帖子进行事实核查。

当AI撰写的笔记在本月晚些时候开始出现在X平台上时,将会有更多的信息被披露,但与此同时,X平台的用户可以立即开始测试AI笔记作者,并很快被考虑纳入AI代理的初始队列。(如果任何Ars的读者最终测试了AI笔记作者,这位Ars的作者很想了解更多关于您的经验。)

为了进行研究,X平台与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的研究生、研究人员和教授合作,调查诸如人类对AI的信任、微调AI和AI安全等主题。

研究人员一致认为,“在某些情况下”,AI代理可以“在时间和精力上花费较少的情况下,生成与人工撰写笔记质量相似的笔记”。他们认为,需要进行更多的研究来克服已标记的风险,以获得“变革性机遇”的好处,这种机遇“有望大幅提高X平台事实核查的规模和速度”。

该论文称,如果AI笔记作者“生成的初始草稿能够代表比单个人工作者通常能代表的更广泛的观点,那么社区审议的质量从一开始就会得到提高”。

AI笔记的未来

研究人员设想,一旦X平台的测试完成,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,而且有一天还可以选择预测会疯传的帖子,并阻止错误信息比人工审核员传播得更快。

他们认为,这种自动化系统带来的额外好处包括X平台笔记评估人员可以快速访问更彻底的研究和证据合成,以及更清晰的笔记撰写,这可以加快评估过程。

研究人员推测,也许有一天,AI代理甚至可以学习预测评估分数,以加快速度。然而,需要进行更多的研究,以确保这不会使社区笔记同质化,使其变得平淡无奇,以至于没有人会阅读它们。

该论文中提出的最具马斯克风格的想法是,用具有冲突观点的AI笔记作者进行训练,以“对抗性地辩论笔记的优点”。据称,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评估员能够做出更明智的判断”。

“评估员现在扮演的是仲裁者的角色——评估结构化的论点冲突,而不是从头开始,”该论文称。

虽然X平台可能正在努力减少X平台用户撰写社区笔记的工作量,但研究人员明确表示,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行橡皮图章式的批准,还需要“从头开始撰写”的人工笔记来训练AI代理,而且一些评估员的专业知识也难以复制。也许最明显的是,人类“具有独特的优势来识别缺陷或偏见”,因此更有可能被迫撰写“自动化作者忽略的主题”的笔记,例如垃圾邮件或诈骗。