AI地震检测:从'戴上眼镜'到地震科学的革命

1

人工智能正在彻底改变地震学领域,通过机器学习技术实现了传统方法难以企及的地震检测能力。正如地震学家凯尔·布拉德利所描述的,采用这些新技术"就像第一次戴上眼镜,突然能够看清树上的叶子一样"。这种转变不仅提高了地震检测的效率,还扩展了科学家对地球内部结构的理解。

地震学基础:从波到洞察

地震发生时,震动波穿过地面,类似于声波在空气中传播。在这两种情况下,我们都可以推断波穿过的材料特性。想象一下敲击墙壁来判断它是否中空——实心墙和空心墙的振动方式不同,我们可以通过声音了解其结构。

地震学中,科学家使用的主要工具是地震仪,它记录地球在三个方向上的运动:上下、南北和东西。当地震发生时,地震仪可以测量特定位置的震动。

传统地震仪

传统上,地震学家需要处理原始地震仪信息以识别地震。地震产生多种类型的震动,以不同速度传播。其中,P波(纵波)和S波(横波)尤为重要,科学家喜欢识别每种波的起始时间。

机器学习前的地震检测

在良好算法出现之前,地震目录编制必须手工完成。德克萨斯大学达拉斯分校的乔·伯恩斯表示,"传统上,美国地质调查局的实验室会有一支主要由本科生或实习生组成的队伍,他们负责查看地震图"。

然而,手工能够发现和分类的地震数量有限。开发有效查找和处理地震的算法一直是该领域的优先事项——特别是自1950年代初计算机出现以来。

布拉德利告诉我:"地震学领域的历史一直随着计算技术的进步而发展"。

然而,传统算法面临一个巨大挑战:它们难以找到较小的地震,特别是在城市等嘈杂环境中。如上图所示,许多不同事件都会引起地震信号。如果方法过于敏感,可能会错误地将其他事件检测为地震。这个问题在城市尤为严重,交通和建筑的持续轰鸣可能会淹没微小地震的信号。

然而,地震具有特征性的"形状"。例如,上图中的7.7级地震与直升机着陆的波形明显不同。

科学家们曾提出的一个想法是使用人工标记的数据集创建模板。如果新波形与现有模板高度相关,则几乎可以确定它是地震。

模板匹配在有足够人工标记示例的情况下效果很好。2019年,加州理工学院扎克·罗斯的实验室使用模板匹配在南加利福尼亚发现了比先前已知多10倍的地震,包括本文开头提到的地震。他们发现的所有160万新地震中,绝大多数都非常小,震级在1级以下。

然而,如果没有广泛的预存在模板数据集,就难以应用模板匹配。这在南加利福尼亚不是问题——那里已有基本完整的1.7级以下地震记录——但在其他地区则是一个挑战。

此外,模板匹配计算成本高昂。使用模板匹配创建南加利福尼亚地震数据集需要200个Nvidia P100 GPU连续运行数天。

地震Transformer:突破性AI模型

AI检测模型解决了所有这些问题:

  • 它们比模板匹配更快。
  • 由于AI检测模型非常小(约35万个参数,与GPT4.0等LLT的数十亿参数相比),它们可以在消费级CPU上运行。
  • AI模型能够很好地推广到原始数据集中未表示的区域。

作为额外优势,AI模型可以提供有关不同类型地震震动到达时间的更准确信息。确定两种最重要波——P波和S波——的到达时间称为"相位拾取",它使科学家能够推断地震的结构。AI模型可以在地震检测的同时完成这一任务。

地震检测(和相位拾取)的基本任务如下所示:

地震Transformer模型输出

前三行代表不同的振动方向(东西向、南北向和上下向)。给定这三个维度的振动数据,我们能否确定是否发生了地震,以及何时开始?

我们希望检测初始P波,它直接来自地震震源。但这可能很棘手,因为P波的回声可能会从其他岩层反射并稍后到达,使波形更加复杂。

因此,理想情况下,我们的模型在每个时间步长输出三个信息:

  1. 该时刻正在发生地震的概率。
  2. 第一条P波在该时刻到达的概率。
  3. 第一条S波在该时刻到达的概率。

我们在第四行看到所有三个输出:绿色表示检测结果,蓝色表示P波到达,红色表示S波到达。(此样本中有两次地震。)

为了训练AI模型,科学家们采用大量标记数据(如上图所示)进行监督训练。我将描述其中最常用的模型之一:地震Transformer(Earthquake Transformer),该模型由斯坦福大学团队在2020年左右开发,由S. Mostafa Mousavi领导,他后来成为哈佛大学教授。

与许多地震检测模型一样,地震Transformer借鉴了图像分类的思想。读者可能熟悉AlexNet,这是一个著名的图像识别模型,在2012年引发了深度学习热潮。

AlexNet使用卷积,这是一种基于物理上接近的像素更可能相关的思想的神经网络架构。AlexNet的第一层将图像分解为小块——每边11个像素——并根据简单特征(如边缘或梯度)的存在对每个块进行分类。

下一层将第一层的分类作为输入,检查更高级别的概念,如纹理或简单形状。

每个卷积层分析图像的更大部分,并在更高级别的抽象上操作。通过最后的层,网络正在查看整个图像并识别"蘑菇"和"集装箱船"等对象。

图像是二维的,因此AlexNet基于二维卷积。相比之下,地震图数据是一维的,因此地震Transformer使用时间维度上的一维卷积。第一层分析0.1秒时间块的振动数据,而后续层则在逐渐更长的时间段内识别模式。

很难说地震模型正在提取的确切模式,但我们可以将其类比为一个使用一维卷积的假设音频转录模型。该模型可能首先识别辅音,然后是音节,然后是单词,然后是句子,时间尺度逐渐增加。

地震Transformer将原始波形数据转换为指示地震和其他地震学重要事件可能性的高级表示集合。随后是一系列反卷积层,精确定位地震及其至关重要的P波和S波发生的时间。

该模型还在模型中间使用了一个注意力层,用于混合时间序列不同部分的信息。注意力机制在大型语言模型中最为著名,它有助于在单词之间传递信息。它在地震图检测中扮演类似角色。地震地震图具有一般结构:P波后跟S波,然后是其他类型的震动。因此,如果一个片段看起来像P波的开始,注意力机制有助于它检查它是否符合更广泛的地震模式。

地震数据扩展

地震Transformer的所有组件都是神经网络文献中的标准设计。其他成功的检测模型,如PhaseNet,甚至更简单。PhaseNet仅使用一维卷积来拾取地震波的到达时间,没有注意力层。

伯恩斯表示,通常来说,地震学领域"不需要发明新架构"。源自图像处理的技术已经足够。

那么,是什么让这些通用架构如此有效呢?数据。大量的数据。

Ars先前曾报道过ImageNet(图像识别基准)的引入如何帮助引发深度学习热潮。大型公开可用的地震数据集在地震学中发挥了类似作用。

地震Transformer使用斯坦福地震数据集(STEAD)进行训练,该数据集包含来自全球的120万个人工标记的地震图数据段。(STEAD的论文明确提到了ImageNet作为灵感来源)。其他模型,如PhaseNet,也在数十万或数百万个标记段上进行了训练。

斯坦福地震数据集中的所有记录地震

数据与架构的组合效果显著。根据伯恩斯的说法,当前的模型在识别和分类地震方面"好得令人难以置信"。通常,机器学习方法在一个区域发现的地震数量是先前识别的10倍或更多。您可以直接在意大利地震目录中看到这一点:

AI检测与传统方法的地震数量对比

AI工具不一定比模板匹配检测到更多地震。但基于AI的技术在计算和劳动密集度方面要低得多,使其对普通研究项目更容易获取,也更易于在世界各地应用。

总之,这些机器学习模型如此出色,以至于它们几乎完全取代了传统的地震检测和相位拾取方法,特别是在较小震级的情况下。

AI在地震科学中的实际应用

地震科学的圣杯是地震预测。例如,科学家们知道在西雅图附近会发生大地震,但几乎无法判断它是明天发生还是一百年后发生。如果我们能够足够精确地预测地震,以便让受影响地区的人员撤离,那将会很有帮助。

您可能会认为AI工具有助于预测地震,但似乎这尚未发生。

康奈尔大学的朱迪思·哈伯德表示,应用更加技术性和不那么花哨。

更好的AI模型为地震学家提供了更全面的地震目录,这解锁了"许多不同的技术",布拉德利说。

最酷的应用之一是理解和成像火山。火山活动产生大量微小地震,其位置有助于科学家理解岩浆系统的结构。在2022年的一篇论文中,约翰·威尔丁及其合作者使用大型AI生成的地震目录创建了夏威夷火山系统结构的惊人图像。

夏威夷火山系统下的地震分布

每个点代表一次单独的地震。他们提供了先前假设的深部Pāhala岩浆复合体与茂纳洛亚浅部火山结构之间岩浆连接的直接证据。您可以在图像中标记为Pāhala-Mauna Loa地震带的箭头中看到这一点。作者还能够将Pāhala岩浆复合体的结构细分为离散的岩浆片。这种细节水平可能促进更好的实时地震监测和更准确的喷发预测。

另一个有前景的领域是降低处理大型数据集的成本。分布式声学传感(DAS)是一种强大的技术,它使用光纤电缆测量电缆整个长度的地震活动。休斯顿大学的李家轩教授表示,单个DAS阵列每天可以产生"数百GB的数据"。这些数据可以产生极高分辨率的数据集——足以分辨出个人的脚步声。

AI工具使得在DAS数据中非常精确地确定地震时间成为可能。在DAS数据相位拾取引入AI技术之前,李和他的一些合作者尝试使用传统技术。虽然这些方法"大致有效",但对于他们的下游分析来说不够准确。没有AI,他的许多工作将会"困难得多",他告诉我。

李也乐观地认为,AI工具将帮助他未来在丰富的DAS数据中分离"新型信号"。

并非所有AI技术都取得了成功

与许多其他科学领域一样,地震学家面临一些采用AI方法的压力,无论这些方法是否与他们的研究相关。

伯恩斯说:"学校希望你把'AI'这个词放在一切前面。这有点失控。"

这可能导致技术上正确但实际无用的论文。哈伯德和布拉德利告诉我,他们看到了许多基于AI技术的论文,这些论文"揭示了对地震工作原理的根本误解"。

他们指出,研究生可能会感到压力,要专门学习AI方法,而减少对科学领域基础知识的学习。他们担心,如果这种AI驱动的研究变得根深蒂固,较老的方法将被"被一种无意义的竞争所淘汰"。

虽然这些问题是真实存在的,Understanding AI也曾经报道过,但我不认为它们削弱了AI地震检测的成功。在过去五年中,基于AI的工作流程几乎完全取代了地震学中的一个基本任务,而且是以更好的方式。

这相当酷。

未来展望:AI地震学的潜力与挑战

尽管AI在地震检测方面取得了显著成功,但地震科学仍有许多领域等待AI技术的深入应用。地震预测——地震学的终极目标——仍然遥不可及。科学家们知道地震会发生,但无法精确预测时间。

AI技术在处理海量地震数据方面展现出巨大潜力。随着分布式声学传感等技术的普及,每天产生的地震数据量呈指数级增长。AI算法能够高效处理这些数据,提取出传统方法可能忽略的微弱信号。

然而,AI在地震科学中的应用也面临挑战。过度依赖AI可能导致研究人员忽视地震学的基础知识。正如伯恩斯和哈伯德所指出的,一些AI研究论文显示出"对地震工作原理的根本误解"。平衡技术创新与科学基础知识的掌握将是地震学家面临的重要课题。

此外,AI模型的透明度和可解释性也是亟待解决的问题。与许多深度学习模型一样,地震检测AI模型通常被视为"黑盒",难以解释其决策过程。提高模型透明度将有助于科学家理解AI的发现,并建立对这些结果的信任。

结论:地震科学的AI时代

AI在地震检测领域的应用代表了科学方法变革的典范。从最初的手工分析,到计算机辅助的模板匹配,再到如今的深度学习模型,地震学经历了显著的技术飞跃。AI不仅提高了地震检测的效率和准确性,还扩展了科学家对地球内部结构的理解。

正如布拉德利所描述的,采用这些新技术"就像第一次戴上眼镜,突然能够看清树上的叶子一样"。这种转变使科学家能够以前所未有的精度和规模研究地震活动,为火山监测、资源勘探和灾害预防提供了新的工具。

虽然AI尚未实现地震预测这一终极目标,但它在数据处理、地震成像和信号识别方面的应用已经为地震科学带来了革命性变化。随着技术的不断进步和更多高质量地震数据的积累,AI在地震科学中的作用将继续扩大,有望为人类提供更深入的地球知识和更有效的灾害应对策略。

这场由AI驱动的地震检测革命,不仅改变了地震学家的工作方式,也重新定义了我们理解地球动态的可能性。正如伯恩斯所言:"这确实是一场革命,但革命仍在继续。"