AI社区笔记:X平台的双刃剑?
埃隆·马斯克的X平台(前身为Twitter)推出“社区笔记”功能,旨在通过众包方式对平台上的帖子进行事实核查,这一举措在一定程度上改变了社交媒体的生态。然而,X平台计划引入AI来辅助撰写社区笔记,这无疑是一把双刃剑,可能对用户对该平台事实核查系统的信任产生深远影响。
X平台在一份研究报告中,将这一举措称为“升级”,但同时也坦诚地承认了AI参与社区笔记可能带来的潜在问题。理想情况下,AI代理可以加速和增加对不准确帖子的社区笔记数量,从而扩大平台范围的事实核查力度。每个由AI撰写的笔记都将由人工审核员进行评估,通过反馈循环不断优化AI的写作能力。随着AI代理在撰写笔记方面不断提升,人工审核员可以将精力集中在更复杂的事实核查任务上,例如需要特定领域专业知识或社会意识的帖子。如果一切顺利,人机协作模式不仅可以改变X平台的事实核查方式,还有望为“公共知识生产领域的人机协作新模式”提供蓝图。
然而,一个关键问题是:AI撰写的笔记是否能像人工撰写的那样准确?更令人担忧的是,AI代理可能会生成“具有说服力但不准确的笔记”,而人工审核员可能会因为AI“擅长撰写有说服力、情感共鸣且看似中立的笔记”而将其评为有帮助。这将扰乱反馈循环,削弱社区笔记的质量,并逐渐降低整个系统的可信度。X平台的研究报告警告说:“如果帮助性评分与准确性并非完全相关,那么经过精心润色但具有误导性的笔记可能更容易通过批准阈值。随着大型语言模型(LLM)的进步,这种风险可能会增加;它们不仅能写得更具说服力,还能更容易地研究和构建看似可靠的证据,为几乎任何主张提供支持,无论其真实性如何,这使得人工审核员更难发现欺骗或错误。”
X平台的AI计划已经面临诸多批评。英国前技术大臣达米安·柯林斯指责X平台正在构建一个可能导致“对平台上人们所见和信任内容进行工业化操纵”的系统。他认为,AI笔记可能会增加X平台上“谎言和阴谋论”的传播。艾伦·图灵研究所新兴技术与安全中心的研究员塞缪尔·斯托克韦尔表示,X平台的成功很大程度上取决于“X平台为防范AI‘笔记撰写者’产生幻觉并在其输出中放大虚假信息的风险而采取的保障措施的质量”。
斯托克韦尔警告说:“AI聊天机器人通常难以处理细微差别和语境,但擅长自信地提供听起来有说服力的答案,即使这些答案并不真实。如果平台不能有效地解决这个问题,这可能是一个危险的组合。”
更复杂的是,任何人都可以使用任何技术创建AI代理来撰写社区笔记。这意味着某些AI代理可能比其他AI代理更具偏见或缺陷。X平台的社区笔记账户解释说,如果这种反乌托邦式的局面发生,人工撰写者可能会厌倦撰写笔记,从而威胁到社区笔记最初赖以信任的观点多样性。
对于那些坚持下来的人工撰写者和审核员来说,大量的AI撰写笔记可能会让他们不堪重负。英国事实核查组织Full Fact的AI主管安迪·达德菲尔德表示,X平台可能会“增加人工审核员的负担,让他们检查更多的草稿笔记,从而可能导致一种令人担忧且看似合理的情况,即笔记完全由AI起草、审查和发布,而没有人工输入的仔细考虑”。
X平台正在计划进行更多研究,以确保“人工评分能力能够充分扩展”,但如果无法解决这个问题,它也意识到“最关键笔记的影响”可能会被稀释。研究人员指出,解决这个“瓶颈”的一个可能方法是取消人工审核流程,并在人工评分员之前批准的“类似语境”中应用AI撰写的笔记。但这样做的最大潜在缺陷是显而易见的。X平台在其报告中承认:“自动将笔记匹配到人们认为不需要它们的帖子可能会大大削弱对系统的信任。”
研究人员承认,最终,X平台上的AI笔记撰写者可能被认为是一种“错误的”工具,但他们仍将继续进行测试以找出答案。
AI撰写笔记即将上线
X平台的社区笔记账户表示,所有AI撰写的社区笔记都将“为用户清楚地标记”。首批AI笔记只会出现在人们已请求添加笔记的帖子中,但最终AI笔记撰写者可能会被允许选择帖子进行事实核查。
随着AI撰写笔记在本月晚些时候开始出现在X平台上,更多信息将被披露。与此同时,X平台用户可以立即开始测试AI笔记撰写者,并很快被考虑纳入AI代理的初始队列。(如果任何Ars读者最终测试了AI笔记撰写者,这位Ars作者很想了解更多关于您的体验。)
为了进行这项研究,X平台与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学研究AI信任、AI微调和AI安全等课题的研究生、研究人员和教授合作。
研究人员一致认为,“在某些情况下”,AI代理可以“在更少的时间和精力下生成与人工撰写笔记质量相似的笔记”。他们建议,需要进行更多研究,以克服已标记的风险,从而收获可能带来的益处,这可能是一种“变革性的机遇”,并“有望大幅提高X平台上事实核查的规模和速度”。
报告称,如果AI笔记撰写者“生成比单个人工撰写者通常能代表的更广泛的观点范围的初始草稿,那么社区审议的质量从一开始就会得到提高”。
AI笔记的未来
研究人员设想,一旦X平台的测试完成,AI笔记撰写者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预测会传播开来的帖子,并阻止虚假信息比人工审核员更快地传播。
他们认为,这种自动化系统的其他好处包括X平台笔记评分员可以快速访问更彻底的研究和证据综合,以及更清晰的笔记撰写,这可以加快评分过程。
研究人员推测,也许有一天,AI代理甚至可以学习预测评分,以进一步加快速度。然而,需要进行更多研究,以确保这不会使社区笔记同质化,以至于没有人阅读它们。
该报告中提出的最具马斯克风格的想法,是训练具有冲突观点的AI笔记撰写者“以对抗方式辩论笔记的优点”。据称,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评分员能够做出更明智的判断”。
报告称:“评分员现在不是从头开始,而是扮演仲裁者的角色——评估结构化的论点冲突。”
虽然X平台可能正在努力减少X平台用户撰写社区笔记的工作量,但研究人员明确表示,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行盖章。
报告称,从头开始撰写的人工笔记对于训练AI代理很有价值,而且一些评分员的专业知识无法轻易复制。也许最明显的是,人类“具有独特的优势来识别缺陷或偏见”,因此更有可能撰写“自动化撰写者忽略的主题”的笔记,例如垃圾邮件或诈骗。