AI革命:地震探测技术的突破与未来

1

"就像第一次戴上眼镜一样"——AI如何提升地震探测能力

人工智能在检测微弱地震方面"好得令人难以置信"——这为何如此重要。

从人工到智能:地震探测的演变

2008年1月1日凌晨1点59分,加利福尼亚州卡利帕特里亚发生了一次地震。你可能从未听说过这次地震,即使当时你正住在卡利帕特里亚,也不会有任何感觉。这次地震的震级为-0.53,震感大约相当于一辆卡车驶过。尽管如此,这次地震之所以引人注目,并非因为其规模,而是因为其微小——而我们却能够探测到它。

在过去七年中,基于计算机视觉的AI工具几乎完全自动化了地震学的一项基本任务:地震检测。这项任务曾经由人类分析师完成,后来由更简单的计算机程序接手,现在则可以由机器学习工具自动快速地完成。

这些机器学习工具能够检测到比人类分析师更小的地震,尤其是在城市等嘈杂环境中。地震提供了关于地球组成和未来可能发生的灾害的宝贵信息。

"在最佳情况下,当你采用这些新技术时,即使使用相同的老旧数据,也像是第一次戴上眼镜,突然能够看清树上的叶子一样,"Kyle Bradley说道,他是《地震洞察》(Earthquake Insights)通讯的联合作者。

我与几位地震科学家交谈,他们都一致认为,在这些特定任务中,机器学习方法已经取代了人类,并且做得更好。

"这真的令人印象深刻,"康奈尔大学教授、Bradley的合著者Judith Hubbard告诉我。

然而,接下来会发生什么则不太确定。地震检测是地震学的基本组成部分,但还有许多其他数据处理任务尚未被颠覆。最大的潜在影响,直到地震预测,都尚未实现。

"这确实是一场革命,"德克萨斯大学达拉斯分校的Joe Byrnes教授说,"但这场革命仍在继续。"

地震学家的日常工作

当地震发生在某个地方时,震动会穿过地面,类似于声波在空气中传播。在这两种情况下,都可以推断出波所穿过的材料。

想象一下敲击墙壁以判断它是否是空心的。因为实心墙壁和空心墙壁的振动方式不同,你可以通过声音来判断其结构。

地震同样遵循这一原理。地震波以不同方式穿过不同材料(岩石、石油、岩浆等),科学家利用这些振动来成像地球内部。

科学家传统使用的主要工具是_地震仪_。这些设备记录地球在三个方向上的运动:上下、南北和东西。如果发生地震,地震仪可以测量特定位置的震动。

传统地震仪

然后,科学家处理原始地震仪信息以识别地震。

机器学习前的地震探测

在优秀算法出现之前,地震编目必须手工完成。Byrnes表示,"传统上,像美国地质调查局实验室这样的机构会有一群主要是本科生或实习生在看地震图。"

然而,手工能够发现和分类的地震数量有限。开发有效查找和处理地震的算法长期以来一直是该领域的优先事项——特别是自20世纪50年代初计算机出现以来。

"地震学领域的历史发展一直伴随着计算技术的进步,"Bradley告诉我。

然而,传统算法面临一个巨大挑战:它们难以找到较小的地震,尤其是在嘈杂的环境中。

常见事件的复合地震图

如上所示的地震图所示,许多不同的事件都可能引起地震信号。如果某种方法过于敏感,就有可能错误地将事件检测为地震。这个问题在城市中尤其严重,那里持续的交通和建筑噪音可能会淹没微小的地震。

然而,地震具有特征性的"形状"。例如,上图中的7.7级地震看起来与直升机降落明显不同。

因此,科学家们的一个想法是从人工标记的数据集中创建模板。如果新的波形与现有模板高度相关,则几乎可以确定是地震。

如果你有足够多的人工标记示例,模板匹配效果非常好。2019年,加州理工学院Zach Ross的实验室使用模板匹配在南加利福尼亚发现了比先前已知多10倍的地震,包括本文开头提到的地震。他们发现的几乎所有160万次新地震都非常小,震级在1级以下。

然而,如果你没有大量预先存在的模板数据集,就难以应用模板匹配。这在南加利福尼亚不是问题——那里已经基本上有完整的1.7级以下地震记录——但在其他地区则是一个挑战。

此外,模板匹配计算成本高昂。使用模板匹配创建南加利福尼亚地震数据集需要200个Nvidia P100 GPU连续运行数天。

必须要有更好的方法。

地震Transformer模型解析

AI检测模型解决了所有这些问题:

  • 它们比模板匹配更快。
  • 因为AI检测模型非常小(约35万个参数,与GPT4.0等LLT的数十亿参数相比),可以在消费级CPU上运行。
  • AI模型能够很好地推广到原始数据集中未代表的地区。

额外的好处是,AI模型可以提供关于不同类型地震震动到达时间的更好信息。对两种最重要的波——P波和S波的到达时间进行计时,称为_相位拾取_。它使科学家能够推断出地震的结构。AI模型可以在地震检测的同时完成这项工作。

地震检测(和相位拾取)的基本任务如下所示:

地震Transformer模型输出示例

前三行代表不同的振动方向(东西、南北和上下)。根据这三个维度的振动,我们能否确定是否发生了地震,以及何时开始?

我们希望检测初始的P波,它直接来自地震震源。但这可能很棘手,因为P波的回声可能会从其他岩层反射并稍后到达,使波形更加复杂。

因此,理想情况下,我们的模型在每个时间步输出三个内容:

  1. 那一刻正在发生地震的概率。
  2. 第一条P波在该时刻到达的概率。
  3. 第一条S波在该时刻到达的概率。

我们在第四行看到了所有三个输出:绿色的检测、蓝色的P波到达和红色的S波到达。(这个样本中有两次地震。)

为了训练AI模型,科学家们获取大量标记数据(如上所示),并进行监督训练。我将描述其中一个最常用的模型:地震Transformer(Earthquake Transformer),它由斯坦福大学团队开发,由S. Mostafa Mousavi领导,他后来成为哈佛大学教授。

与许多地震检测模型一样,地震Transformer借鉴了图像分类的思想。读者可能熟悉AlexNet,这是一个著名的图像识别模型,它在2012年掀起了深度学习热潮

AlexNet使用了卷积,这是一种神经网络架构,基于物理上接近的像素更可能相关的思想。AlexNet的第一层卷积将图像分解成小块——每边11个像素——并根据边缘或梯度等简单特征的存在对每个块进行分类。

下一层将第一层的分类作为输入,检查更高级别的概念,如纹理或简单形状。

每个卷积层分析图像的更大部分,并在更高级别的抽象上操作。通过最后的层,网络正在查看整个图像并识别"蘑菇"和"集装箱船"等物体。

图像是二维的,因此AlexNet基于二维卷积。相比之下,地震图数据是一维的,因此地震Transformer使用一维卷积处理时间维度。第一层分析0.1秒时间块的振动数据,而后续层则在逐渐更长的时间周期内识别模式。

很难说地震模型具体提取了什么模式,但我们可以将其类比为使用一维卷积的假设音频转录模型。该模型可能首先识别辅音,然后是音节,然后是单词,然后是句子,时间尺度逐渐增加。

地震Transformer将原始波形数据转换为一系列高级表示,指示地震和其他地震学重要事件的可能性。随后是一系列反卷积层,精确定位地震及其极其重要的P波和S波发生的时间。

该模型还在模型中间使用了一个注意力层,用于混合时间序列不同部分的信息。注意力机制在大型语言模型中最著名,它有助于在单词之间传递信息。它在地震图检测中扮演类似角色。地震地震图具有一般结构:P波后跟S波,然后是其他类型的震动。因此,如果某个片段看起来像是P波的开始,注意力机制有助于它检查它是否符合更广泛的地震模式。

扩展地震数据规模

地震Transformer的所有组件都来自神经网络文献的标准设计。其他成功的检测模型,如相位网络,甚至更简单。相位网络仅使用一维卷积来拾取地震波的到达时间。没有注意力层。

根据Byrnes的说法,通常来说,"地震学领域并没有太多需要发明新架构的必要"。源自图像处理的技术已经足够。

那么,是什么让这些通用架构如此有效?数据。大量的数据。

Ars之前曾报道过ImageNet(一个图像识别基准)的引入如何帮助引发深度学习热潮。大型公开可用的地震数据集在地震学中发挥了类似作用。

地震Transformer使用斯坦福地震数据集(STEAD)进行训练,该数据集包含来自全球的120万个人类标记的地震图数据段。(STEAD的论文明确提到了ImageNet作为灵感)。其他模型,如相位网络,也在数十万或数百万个标记段上进行了训练。

斯坦福地震数据集中的所有记录地震

数据和架构的组合效果很好。根据Byrnes的说法,当前的模型在识别和分类地震方面"好得令人难以置信"。通常,机器学习方法发现的地震数量是先前在同一地区识别的10倍或更多。你可以在意大利地震目录中直接看到这一点:

AI技术对地震探测的影响

AI工具不一定比模板匹配检测到更多地震。但基于AI的技术计算和人工密集程度低得多,使得平均研究项目更容易使用,也更容易在世界各地应用。

总的来说,这些机器学习模型非常擅长识别和分类地震,特别是对于较小震级的地震,它们几乎完全取代了传统方法。

AI地震探测的实际应用

地震科学的圣杯是地震预测。例如,科学家知道西雅图附近将发生大地震,但几乎无法知道它是在明天还是一百年后发生。如果我们能够足够精确地预测地震,以便让受影响地区的人员撤离,那将非常有帮助。

你可能认为AI工具有助于预测地震,但似乎这尚未实现。

康奈尔的Judith Hubbard表示,应用更加技术性,也不那么引人注目。

更好的AI模型为地震学家提供了更全面的地震目录,这解锁了"许多不同的技术",Bradley说。

最酷的应用之一是理解和成像火山。火山活动产生大量小地震,其位置有助于科学家了解岩浆系统的结构。在2022年的论文中,John Wilding及其合作者使用大型AI生成的地震目录创建了夏威夷火山系统的这一惊人图像。

每个点代表一个单独的地震

他们提供了之前假设的深部帕哈拉岩浆复合体与茂纳洛亚浅部火山结构之间岩浆连接的直接证据。你可以在图像中标记为帕哈拉-茂纳洛亚地震带的箭头中看到这一点。作者还能够将帕哈拉岩浆复合体的结构细分为离散的岩浆层。这种级别的细节可能促进更好的实时地震监测和更准确的火山喷发预测。

另一个有前景的领域是降低处理大型数据集的成本。分布式声学传感(DAS)是一种强大的技术,它使用光纤电缆测量整个电缆长度的地震活动。根据休斯顿大学教授Jiaxuan Li的说法,单个DAS阵列每天可以产生"数百GB的数据"。这些数据可以产生极高分辨率的数据集——足以分辨出单个脚步声。

AI工具使得在DAS数据中非常精确地计时地震成为可能。在DAS数据中引入相位拾取的AI技术之前,Li和他的一些合作者尝试使用传统技术。虽然这些技术"大致可行",但对于他们的下游分析来说不够准确。没有AI,他的许多工作将会"困难得多",他告诉我。

Li也乐观地认为,AI工具未来将能够帮助他在丰富的DAS数据中分离出"新型信号"。

并非所有AI技术都取得了成功

与许多其他科学领域一样,地震学家面临一些采用AI方法的压力,无论这些方法是否与他们的研究相关。

"学校希望你把AI这个词放在一切前面,"Byrnes说,"这有点失控了。"

这可能导致技术上正确但实际上无用的论文。Hubbard和Bradley告诉我,他们看到很多基于AI技术的论文,这些论文"揭示了对地震工作原理的根本误解。"

他们指出,研究生可能会感到压力,不得不专门学习AI方法,而较少学习该科学领域的基础知识。他们担心,如果这种AI驱动的研究变得根深蒂固,较老的方法将被"某种无意义所淘汰。"

尽管这些问题确实存在,并且Understanding AI之前也曾报道过,但我认为它们并不影响AI地震检测的成功。在过去的五年中,基于AI的工作流程几乎完全取代了地震学中的一项基本任务,而且效果更好。

这相当酷。

未来展望:AI地震学的挑战与机遇

尽管AI在地震检测方面取得了显著成功,但地震学家们对未来发展方向持谨慎乐观态度。地震预测,这一地震学的终极目标,仍然遥不可及。AI技术目前能够提高我们对地震的理解和检测能力,但尚未实现准确预测地震发生的时间和地点。

然而,在地球成像、火山监测和灾害风险评估等领域,AI正展现出巨大潜力。随着计算能力的提升和算法的改进,我们有望看到AI在地震科学中发挥更重要的作用。同时,科学界也需要保持警惕,避免盲目追求技术而忽视科学本质。

地震学的发展历程告诉我们,技术进步应当服务于科学探索,而非相反。在AI与地震学的结合中,我们看到了技术与科学相互促进的典范,也为其他领域的跨学科研究提供了有益启示。