AI社区笔记:X平台的双刃剑?
埃隆·马斯克旗下的X平台(前推特)一直以来都试图通过“社区笔记”功能来革新社交媒体的事实核查机制。这个众包模式旨在汇集各方观点,判断X平台上信息的可靠性。然而,X平台计划引入AI来撰写社区笔记,这无疑是一把双刃剑,可能重塑,也可能摧毁用户对该系统仅存的信任。
X平台在一份研究报告中,将这一举措描述为“升级”,但同时也坦诚地列出了AI社区笔记可能引发的各种问题。理想情况下,AI代理能够加速和扩大社区笔记的覆盖范围,从而提升平台整体的事实核查效率。每一条AI生成的笔记都将由人工审核员评估,通过反馈循环不断优化AI的写作能力。随着AI水平的提升,人工审核员便可以将精力集中在更复杂、需要专业知识或社会意识的 nuanced 内容上。X平台认为,如果一切顺利,这种人机协作模式不仅能改变X平台的事实核查方式,甚至可以为“公共知识生产领域的人工智能协作新模式”提供蓝图。
AI社区笔记潜在的风险
然而,一个关键问题是:AI撰写的笔记是否能像人工笔记一样准确?更令人担忧的是,AI代理可能会生成“具有说服力但不准确的笔记”,由于AI“擅长撰写具有说服力、情感共鸣且看似中立的笔记”,人工审核员可能会误判其为有帮助的。这将扰乱反馈循环,降低社区笔记的质量,并最终损害整个系统的可信度。X平台的研究报告警告说:“如果笔记的有用性评分与准确性并非完全相关,那么经过精心修饰但具有误导性的笔记可能更容易通过审核。随着LLM(大型语言模型)的进步,这种风险可能会增加;它们不仅能写得更具说服力,还能更容易地研究和构建看似可靠的证据,掩盖真相,让人工审核员更难发现欺骗或错误。”
X平台的AI计划已经引来了批评。英国前技术部长达米安·柯林斯指责X平台正在构建一个可能导致“对人们在平台上看到和信任的内容进行大规模操纵”的系统。拥有超过6亿用户的X平台,其信息操纵的潜在影响不容小觑。《卫报》报道指出,柯林斯认为AI笔记可能会增加X平台上“谎言和阴谋论”的传播。艾伦·图灵研究所新兴技术与安全中心的 Samuela Stockwell 也表达了类似的担忧,他认为X平台的成功很大程度上取决于“X平台为防范AI‘笔记作者’产生幻觉并在其输出中放大错误信息而采取的保护措施的质量”。
“AI聊天机器人通常难以处理细微差别和语境,但擅长自信地提供听起来有说服力的答案,即使这些答案是不真实的,”Stockwell 说道。“如果平台不能有效解决这个问题,这可能是一个危险的组合。”
潜在的滥用和挑战
更复杂的是,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他代理更具偏见或存在缺陷。如果出现这种情况,X平台预测人工作者可能会厌倦撰写笔记,从而威胁到社区笔记最初赖以建立的可信度的多样性观点。即使有人工作者和审核员继续参与,大量的AI撰写笔记也可能会让他们不堪重负。英国事实核查机构 Full Fact 的 AI 负责人 Andy Dudfield 告诉《卫报》,X平台面临的风险是“增加人工审核员检查更多草稿笔记的负担,从而开启一种令人担忧且看似合理的情况,即笔记可能完全由 AI 起草、审核和发布,而没有人工输入提供的仔细考虑”。
X平台计划进行更多研究,以确保“人工评估能力能够充分扩展”,但如果无法解决这个难题,那么“最关键的笔记的影响”可能会被稀释。研究人员指出,解决这个“瓶颈”的一个可能方法是取消人工审核过程,并在人工评估员先前批准的“类似语境”中应用AI撰写的笔记。但这样做最大的潜在风险显而易见。“自动将笔记与人们认为不需要它们的帖子进行匹配,可能会严重损害对系统的信任,”X平台的文件承认。
研究人员承认,最终,X平台上的AI笔记作者可能会被认为是一种“错误的”工具,但他们仍将继续进行测试以找出答案。
AI笔记的未来展望
研究人员设想,一旦X平台完成测试,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,还可以选择预测会疯传的帖子,并阻止错误信息比人工审核员更快地传播。他们认为,这种自动化系统还可以带来额外的好处,包括X平台的笔记评估员可以快速访问更彻底的研究和证据综合,以及更清晰的笔记构成,从而加快评估过程。研究人员推测,也许有一天,AI代理甚至可以学习预测评分,从而进一步加快速度。然而,需要更多的研究来确保这不会使社区笔记同质化,以至于没有人阅读它们。
该论文中提出的最具马斯克风格的想法是,训练具有冲突观点的AI笔记作者“以对抗方式辩论笔记的优点”。据称,这“可以立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评估员能够做出更明智的判断”。论文称:“评估员现在扮演的是仲裁者的角色——评估结构化的论点冲突,而不是从头开始。”
虽然X平台可能正在努力减少X平台用户撰写社区笔记的工作量,但研究人员明确表示,AI永远无法取代人类。人类不仅需要对AI撰写的笔记进行橡皮图章式的批准,而且“从头开始撰写”的人工笔记对于训练AI代理至关重要,并且一些评估员的专业知识是无法轻易复制的。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能撰写“自动作者忽略的主题”的笔记,例如垃圾邮件或诈骗。
结论
X平台在AI社区笔记上的探索是一场豪赌。如果成功,它将极大地提升平台的事实核查能力,并为社交媒体的信息生态带来积极的改变。然而,潜在的风险同样巨大,如果AI被滥用或出现技术缺陷,可能会加剧虚假信息的传播,损害用户对平台的信任。X平台能否在AI的帮助下打造一个更值得信赖的信息环境,仍然有待观察。
AI驱动的社区笔记将于本月开始发布
X平台的社区笔记帐户表示,所有AI撰写的社区笔记“都将为用户明确标记”。该帐户表示,第一批AI笔记只会出现在人们要求添加笔记的帖子中,但最终可能会允许AI笔记作者选择帖子进行事实核查。
当AI撰写的笔记在本月晚些时候开始出现在X平台上时,将会透露更多信息,但与此同时,X平台用户可以立即开始测试AI笔记作者,并很快被考虑纳入AI代理的初始队列。(如果任何Ars读者最终测试了AI笔记作者,这位Ars作家会很想了解更多关于你的经历。)
为了进行研究,X平台与研究生、研究附属机构和教授合作,调查哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的AI信任、微调AI和AI安全等主题。
研究人员一致认为,“在某些情况下”,AI代理可以“在时间和精力方面以一小部分成本生成与人工撰写笔记质量相似的笔记”。他们认为,需要更多的研究来克服已标记的风险,以获得“变革性机会”的好处,这种机会“有望显着提高X平台事实核查的规模和速度”。
该论文称,如果AI笔记作者“生成的初始草稿比单个人工作者通常能代表的更广泛的视角,那么从一开始就提高了社区审议的质量”。