AI“核”爆阴影:lowbackgroundsteel.ai如何守护前AI时代的内容净土?

1

在科技飞速发展的今天,人工智能(AI)已经渗透到我们生活的方方面面,尤其是在内容创作领域,其影响力更是日益显著。然而,正如核武器试验对全球钢铁产业造成辐射污染一样,AI生成内容的爆炸式增长也给原创内容的纯洁性带来了前所未有的挑战。本文将深入探讨这一现象,并介绍一项旨在保护“前AI时代”人类创作的珍贵遗产的倡议。

AI时代的“低本底钢”

在冷战时期,核武器试验释放的辐射污染了全球新生产的钢铁,使得科学家们不得不从沉没于海底的旧船残骸中寻找未经污染的“低本底钢”,以用于制造对辐射敏感的精密仪器。如今,随着ChatGPT等AI模型的广泛应用,互联网上的内容也面临着类似的“污染”。

前Cloudflare高管John Graham-Cumming敏锐地意识到了这一问题,并创建了一个名为lowbackgroundsteel.ai的网站。该网站旨在收集和整理2022年之前由人类创作的、未受AI影响的文本、图像和视频资源,就像一个数字化的“低本底钢”仓库,为后人保留一份纯粹的人类创造力样本。

Mushroom cloud from Ivy Mike nuclear test

AI污染的代价:研究项目的陨落

AI生成内容的泛滥已经对学术研究产生了实际影响。由研究员Robyn Speer创建的Python库wordfreq,旨在通过分析数百万个来源(包括维基百科、电影字幕、新闻文章和社交媒体)来追踪40多种语言的词频使用情况。然而,由于网络上充斥着大量由大型语言模型生成的无意义内容,wordfreq项目于2024年9月宣布停止更新。

这一案例凸显了AI污染对数据质量的潜在威胁。如果用于训练AI模型的数据本身就受到了AI生成内容的影响,那么模型的性能和可靠性将不可避免地受到损害。此外,一些研究人员还担心AI模型会陷入“模型崩溃”的困境,即模型在训练过程中不断重复自身的输出,导致质量逐渐下降。

“模型崩溃”:杞人忧天还是未雨绸缪?

“模型崩溃”是指AI模型在训练过程中,由于过度依赖自身生成的数据而导致性能下降的现象。尽管一些研究人员对此表示担忧,但最新的研究表明,在特定条件下,这种担忧可能被夸大了。Gerstgrasser等人的研究表明,当合成数据与真实数据结合使用时,可以有效避免模型崩溃。事实上,经过适当的管理和筛选,来自AI模型的合成数据甚至可以辅助训练出更强大、更先进的模型。

人类表达的时间胶囊

John Graham-Cumming长期致力于技术保护工作。他曾创建开源电子邮件垃圾邮件过滤程序POPFile,并成功请愿英国政府为迫害密码破译员Alan Turing道歉。他对保护人类创作的执着也体现在lowbackgroundsteel.ai网站上。该网站并非横空出世,早在2023年3月就已经创建,只是最近才正式对外宣布。

该网站汇集了多个重要的“前AI内容”档案,包括2022年8月的维基百科转储(早于ChatGPT发布)、古腾堡计划的公共领域书籍合集、美国国会图书馆的照片档案以及GitHub的北极代码库(2020年2月埋藏在北极附近废弃煤矿中的开源代码快照)。此外,wordfreq项目也被收录其中,仿佛被封存在AI污染之前的时光里。

lowbackgroundsteel.ai网站还接受用户提交其他“前AI内容”来源。Graham-Cumming强调,该项目的目的在于记录AI时代之前的人类创造力,而非反对AI本身。正如大气核试验结束后,本底辐射恢复到自然水平一样,低本底钢最终变得不再必要。前AI内容是否会遵循类似的轨迹,还有待时间来检验。

保护人类创造力:时不我待

在AI日益普及的今天,保护人类创造力的源泉显得尤为重要。正如我在2020年提出的“密码方舟”概念一样,我们需要创建一个带有时间戳的“前AI媒体”档案,以便未来的历史学家能够验证其真实性。AI生成的内容不仅污染了当前的舆论环境,还可能混淆历史记录。因此,lowbackgroundsteel.ai的出现恰逢其时,它为我们提供了一个反思和保护人类创造力的机会。

Photo of Benj Edwards

lowbackgroundsteel.ai作为一个不起眼的目录,记录了“前AI时代”的人类表达。它是一个数字考古项目,标志着人类生成文化与人机混合文化之间的分界线。在区分人类和机器输出变得越来越困难的时代,这些档案可能对于理解AI进入对话之前人类交流的演变过程至关重要。

结语:守护人类智慧的火花

AI技术的发展无疑为内容创作带来了诸多便利,但我们不能因此忽视其潜在的负面影响。lowbackgroundsteel.ai的出现提醒我们,在追求技术进步的同时,也要保护好人类的原创精神和创造力。只有这样,我们才能确保AI真正成为人类的助手,而不是取代我们思考和表达的能力。让我们共同努力,守护人类智慧的火花,照亮未来的道路。