在科技日新月异的时代,人工智能(AI)正以前所未有的速度渗透到我们生活的方方面面。2025年,社交媒体巨头X(前身为Twitter)大胆尝试将AI引入社区笔记功能,这一举措旨在提升平台内容审核的效率与覆盖面。然而,这项创新之举在提升效率的同时,也潜藏着诸多风险。本文将深入探讨X平台AI社区笔记的潜在问题,并分析其可能对信息生态带来的深远影响。
X平台社区笔记的初衷是利用群体智慧,对平台上的信息进行事实核查与标注,从而提高信息的透明度与可信度。然而,当AI开始执笔社区笔记,情况变得复杂起来。尽管X平台认为AI能够加速信息审核流程,覆盖更广泛的内容,但事实证明,AI在处理复杂、微妙的社会议题时,往往难以达到人类的判断水准。
X平台的研究报告坦承,AI生成的社区笔记可能并不如人工撰写的那般准确。更令人担忧的是,AI可能会生成“具有说服力但不准确的笔记”,由于AI在情感渲染和措辞上的优势,这些笔记甚至可能被人类评审员误判为有帮助。这种偏差一旦形成,将严重破坏社区笔记的公信力,使整个系统的可靠性大打折扣。
正如报告中指出的那样,“如果评分的帮助性与准确性并非完全相关,那么经过精心润色但具有误导性的笔记可能更容易通过批准阈值。”随着大型语言模型(LLM)的不断发展,它们不仅能够更具说服力地写作,还能更轻松地研究和构建看似有力的证据来支持几乎任何主张,无论其真实性如何,这使得人类评审员更难发现欺骗或错误。
前英国技术大臣Damian Collins对X平台的AI计划提出了严厉批评,他认为该系统可能被用于大规模操纵人们在平台上的信任和认知。Collins担心,AI笔记可能助长“谎言和阴谋论”的传播。Alan Turing研究所新兴技术与安全中心的研究员Samuel Stockwell也表达了类似的担忧,他强调X平台的成功在很大程度上取决于其对AI“笔记作者”可能产生的幻觉和信息放大风险的防范措施。
Stockwell指出,AI聊天机器人常常难以把握细微之处和语境,但却擅长自信地提供听起来有说服力的答案,即使这些答案并不真实。“如果平台不能有效地解决这个问题,那将是一个危险的组合。”
更令人担忧的是,任何人都可以利用任何技术创建AI代理来撰写社区笔记。这意味着,不同的AI代理可能存在不同的偏见或缺陷。如果这种情况发生,X平台担心人工撰写者可能会因此失去积极性,从而威胁到社区笔记最初赖以生存的观点多样性。
即使仍有人工撰写者和评审员坚守岗位,他们也可能被AI生成的大量笔记所淹没。英国事实核查机构Full Fact的AI主管Andy Dudfield警告说,X平台可能会“增加人工评审员的负担,使他们需要检查更多的草稿笔记,从而可能导致笔记完全由AI起草、审查和发布,而没有人工输入的仔细考虑”。
X平台计划进行更多研究,以确保“人工评级能力能够充分扩展”,但如果无法解决这个问题,那么“最关键的笔记的影响”可能会被稀释。研究人员提出的一个可能的解决方案是取消人工审查过程,并在人工评审员先前批准的“类似情况”中应用AI撰写的笔记。然而,这样做的最大潜在缺陷是显而易见的。
X平台的报告承认:“自动将笔记匹配到人们认为不需要它们的帖子可能会严重破坏对该系统的信任。”最终,AI笔记作者可能被认为是“错误的”工具,但他们仍在继续测试以找出答案。
X平台表示,所有AI撰写的社区笔记都将“为用户清楚地标明”。最初,AI笔记只会出现在人们要求添加笔记的帖子中,但最终,AI笔记作者可能会被允许选择帖子进行事实核查。
X平台与哈佛大学、麻省理工学院、斯坦福大学和华盛顿大学的博士后学生、研究人员和教授合作,研究诸如人类对AI的信任、微调AI和AI安全等主题。研究人员一致认为,“在某些情况下”,AI代理可以“以人工编写的笔记相似的质量生成笔记——而且所需的时间和精力只是其中的一小部分”。他们认为,要充分利用这一“变革性机遇”,还需要进行更多研究,以克服已发现的风险。这一机遇“有望显著提高X平台事实核查的规模和速度”。
报告指出,如果AI笔记作者“生成的初始草稿比单个人工作者通常能代表的更广泛的观点,那么从一开始就可以提高社区审议的质量”。研究人员设想,一旦X平台的测试完成,AI笔记作者不仅可以帮助研究人工用户标记的问题帖子,还可以有一天选择预计会迅速传播的帖子,并阻止错误信息比人工评审员更快地传播。
他们认为,这种自动化系统带来的额外好处包括X平台笔记评分者可以快速访问更彻底的研究和证据综合,以及更清晰的笔记组成,这可以加快评分过程。研究人员推测,也许有一天,AI代理甚至可以学习预测评分,以进一步加快速度。然而,还需要进行更多研究,以确保这不会使社区笔记同质化,以至于没有人阅读它们。
该报告中提出的最具马斯克风格的想法可能是训练具有冲突观点的AI笔记作者“以对抗方式辩论笔记的优点”。据称,这“可以帮助立即发现潜在的缺陷、隐藏的偏见或捏造的证据,从而使人工评分者能够做出更明智的判断”。
“评分者现在扮演着仲裁者的角色——评估结构化的论点冲突,而不是从头开始,”报告说。
虽然X平台可能正在努力减少X平台用户撰写社区笔记的工作量,但研究人员表示,很明显,AI永远无法取代人类。这些人不仅需要对AI撰写的笔记进行橡皮图章式地批准,还需要其他更多的工作。
报告称,从头开始撰写的人工笔记对于训练AI代理非常有价值,并且一些评分者的专业知识是无法轻易复制的。也许最明显的是,人类“具有独特的识别缺陷或偏见的能力”,因此更有可能被迫撰写“自动化作者忽略的主题”的笔记,例如垃圾邮件或诈骗。
综上所述,X平台引入AI社区笔记是一项充满希望但也伴随着风险的举措。如何在利用AI提升效率的同时,确保信息的准确性、公正性与多样性,将是X平台乃至整个社交媒体行业面临的共同挑战。