在地震学领域,一项基础性工作正在经历前所未有的变革——地震检测。过去,这项任务依赖人工分析师逐小时检查地震图数据,而现在,基于计算机视觉的AI工具几乎完全自动化了这一过程。正如地震洞察通讯的共同作者凯尔·布拉德利所说:"采用这些新技术,即使是在相同的老数据上,也像是第一次戴上眼镜,突然能够看清树上的叶子一样。"
地震学的基础:从原理到工具
当某地发生地震时,震动会通过地面传播,类似于声波在空气中传播的方式。在这两种情况下,我们都可以推断出波所穿过的材料特性。
想象一下敲击墙壁来判断它是否中空。由于实心墙壁和空心墙壁的振动方式不同,我们可以通过声音判断其结构。地震也是如此,地震波在不同材料(岩石、石油、熔岩等)中的传播方式不同,科学家利用这些振动来成像地球内部。
科学家传统使用的主要工具是地震仪,这些设备记录地球在三个方向上的运动:上下、南北和东西。如果发生地震,地震仪可以测量特定位置的震动。
传统的物理地震仪。现代地震仪以数字方式记录数据。
科学家随后处理原始地震仪信息以识别地震。地震产生多种类型的震动,以不同速度传播。其中,初波(P波)和次波(S波)两种类型尤为重要,科学家喜欢识别每种波的开始时间。
机器学习前的地震检测
在良好的算法出现之前,地震目录必须手工创建。伯恩斯表示:"传统上,美国地质调查局实验室会有一支主要由本科生或实习生组成的团队查看地震图。"
然而,手工能够发现和分类的地震数量有限。创建有效查找和处理地震的算法长期以来一直是该领域的优先事项——特别是在20世纪50年代初计算机出现后。
布拉德利告诉我:"地震学领域的历史发展始终与计算技术的进步同步。"
然而,传统算法面临一个大挑战:它们不容易找到较小的地震,尤其是在嘈杂的环境中。如上所示的地震图中,许多不同事件都会引起地震信号。如果方法过于敏感,就有可能错误地将事件检测为地震。在城市中,这个问题尤其严重,因为交通和建筑的持续嗡声可能会淹没小型地震。
常见事件的复合地震图。注意每个事件的形状略有不同。
然而,地震具有特征性的"形状"。例如,上面显示的7.7级地震看起来与直升机降落明显不同。
因此,科学家们的一个想法是从人工标记的数据集中创建模板。如果新的波形与现有模板高度相关,则几乎可以确定是地震。
如果您有足够多的人工标记示例,模板匹配效果非常好。2019年,加州理工学院扎克·罗斯的实验室使用模板匹配在南加利福尼亚发现了比以往多10倍的地震,包括本文开头提到的地震。他们发现的所有160万新地震中,绝大多数都非常小,震级在1级以下。
然而,如果您没有大量预先存在的模板数据集,就很难应用模板匹配。这在南加利福尼亚不是问题——那里已经有基本完整的地震记录,震级低至1.7级——但在其他地方则是一个挑战。
此外,模板匹配计算成本高昂。使用模板匹配创建南加利福尼亚地震数据集需要200个英伟达P100 GPU连续运行数天。
必须要有更好的方法。
地震转换器:AI地震检测的突破
AI检测模型解决了所有这些问题:
- 它们比模板匹配更快。
- 由于AI检测模型非常小(约350,000个参数,与GPT4.0等LLM的数十亿参数相比),它们可以在消费级CPU上运行。
- AI模型对原始数据集中未表示的区域具有良好的泛化能力。
此外,AI模型可以提供关于不同类型地震震动到达时间的更好信息。对两种最重要的波——P波和S波——的到达时间进行计时称为相位拾取。它使科学家能够推断地震的结构。AI模型可以在地震检测的同时完成这项工作。
地震检测(和相位拾取)的基本任务如下所示:
前三行代表不同的振动方向(东西、南北和上下)。基于这三个维度的振动,我们能否确定是否发生了地震,以及何时开始?
我们希望检测初始的P波,它直接从地震源到达。但这可能很棘手,因为P波的回声可能会从其他岩层反射并稍后到达,使波形更加复杂。
因此,理想情况下,我们的模型在每个时间步输出三个内容:
- 该时刻正在发生地震的概率。
- 该时刻第一个P波到达的概率。
- 该时刻第一个S波到达的概率。
我们在第四行看到所有三个输出:绿色表示检测,蓝色表示P波到达,红色表示S波到达。(此样本中有两个地震。)
为了训练AI模型,科学家们采用大量标记数据,如上图所示,进行监督训练。我将描述一个最常用的模型:地震转换器,该模型由斯坦福大学团队于2020年左右开发,由S. Mostafa Mousavi领导,他后来成为哈佛大学教授。
与许多地震检测模型一样,地震转换器采用了图像分类的思想。读者可能熟悉AlexNet,这是一个著名的图像识别模型,在2012年引发了深度学习热潮。
AlexNet使用卷积,这是一种神经网络架构,基于物理上接近的像素更可能相关的思想。AlexNet的第一层将图像分解成小块——每边11个像素——并根据边缘或梯度等简单特征的存在对每个块进行分类。
下一层将第一层的分类作为输入,检查更高级别的概念,如纹理或简单形状。
每个卷积层分析图像的更大部分并在更高级别的抽象上操作。到最后几层时,网络正在查看整个图像并识别"蘑菇"和"集装箱船"等对象。
图像是二维的,因此AlexNet基于二维卷积。相比之下,地震图数据是一维的,因此地震转换器使用时间维度上的一维卷积。第一层分析0.1秒的振动数据块,而后续层在逐渐更长的时间段内识别模式。
很难说地震模型正在提取的确切模式,但我们可以将其与使用一维卷积的假设音频转录模型进行类比。该模型可能首先识别辅音,然后是音节,然后是单词,然后是句子,时间尺度逐渐增加。
地震转换器将原始波形数据转换为表示地震和其他地震学重要事件可能性的高级表示集合。然后是一系列反卷积层,精确定位地震及其极其重要的P波和S波发生的时间。
该模型还在模型中间使用了一个注意力层,以混合时间序列不同部分的信息。注意力机制在大型语言模型中最为著名,它有助于在单词之间传递信息。它在地震图检测中扮演类似角色。地震地震图具有一般结构:P波后跟S波,然后是其他类型的震动。因此,如果一个片段看起来像P波的开始,注意力机制有助于它检查它是否符合更广泛的地震模式。
规模化地震数据
地震转换器的所有组件都来自神经网络文献中的标准设计。其他成功的检测模型,如PhaseNet,甚至更简单。PhaseNet仅使用一维卷积来拾取地震波的到达时间,没有注意力层。
伯恩斯表示,一般来说,地震学领域"没有太多需要发明新架构的必要性"。从图像处理中衍生出的技术已经足够。
那么,是什么让这些通用架构如此有效呢?数据。大量的数据。
Ars此前曾报道过ImageNet(图像识别基准)的引入如何帮助引发了深度学习热潮。大型公开可用的地震数据集在地震学中发挥了类似作用。
地震转换器使用**斯坦福地震数据集(STEAD)**进行训练,该数据集包含来自全球的120万个人工标记的地震图数据段。(STEAD的论文明确提到了ImageNet作为灵感来源)。其他模型,如PhaseNet,也在数十万或数百万个标记段上进行了训练。
斯坦福地震数据集中记录的所有地震。
数据和架构的组合效果很好。根据伯恩斯的说法,当前的模型在识别和分类地震方面"好得可笑"。通常,机器学习方法在一个区域内发现的地震数量是先前识别的10倍或更多。您可以直接在意大利地震目录中看到这一点:
来自Beroza等人的《机器学习与地震预测——下一步》。
AI工具不一定比模板检测更多的地震。但基于AI的技术在计算和劳动密集度方面要低得多,使其对普通研究项目更具可访问性,也更容易在世界各地应用。
总之,这些机器学习模型如此出色,以至于它们几乎完全取代了传统的地震检测和相位拾取方法,特别是对于较小的震级。
AI在地震学中的实际应用
地震科学的圣杯是地震预测。例如,科学家知道西雅图附近将发生大地震,但几乎无法知道它会在明天还是一百年后发生。如果我们能够足够精确地预测地震,以便让受影响地区的人们撤离,那将会很有帮助。
您可能会认为AI工具有助于预测地震,但似乎这还没有发生。
康奈尔大学的朱迪思·哈伯德表示,应用更多是技术性的,而不是浮夸的。
更好的AI模型为地震学家提供了更全面的地震目录,这解锁了"许多不同的技术",布拉德利说。
最酷的应用之一是理解和成像火山。火山活动产生大量小型地震,其位置有助于科学家理解岩浆系统。在2022年的一篇论文中,约翰·威尔丁及其合作者使用大型AI生成的地震目录创建了夏威夷火山系统的这一惊人图像。
每个点代表一个单独的地震。
他们提供了之前假设的深部Pāhala岩浆复合体与茂纳罗亚浅层火山结构之间岩浆连接的直接证据。您可以在图像中看到这个用Pāhala-Mauna Loa地震活动带标记的箭头。作者还能够将Pāhala岩浆复合体的结构细分为离散的岩浆片。这种细节水平可能促进更好的实时地震监测和更准确的喷发预测。
另一个有前景的领域是降低处理大型数据集的成本。分布式声学传感(DAS)是一种强大的技术,它使用光纤电缆测量电缆整个长度的地震活动。休斯顿大学教授李佳轩表示,单个DAS阵列每天可以产生"数百GB的数据"。这些数据可以产生极高分辨率的数据集——足以分辨出单个脚步声。
AI工具使得在DAS数据中非常精确地计时地震成为可能。在DAS数据中引入相位拾取的AI技术之前,李和他的一些合作者尝试使用传统技术。虽然这些技术"大致有效",但不够准确,无法满足他们的下游分析需求。没有AI,他的许多工作将会"困难得多",他告诉我。
李也乐观地认为,AI工具将来能够帮助他在丰富的DAS数据中分离"新型信号"。
并非所有AI技术都取得了成功
与许多其他科学领域一样,地震学家面临一些采用AI方法的压力,无论这些方法是否与他们的研究相关。
伯恩斯说:"学校希望你把AI这个词放在一切前面。这有点失控了。"
这可能导致技术上合理但实际无用的论文。哈伯德和布拉德利告诉我,他们看到了许多基于AI技术的论文,这些论文"揭示了对地震工作原理的基本误解"。
他们指出,研究生可能感到压力,要专门学习AI方法,而牺牲了对该科学领域基础知识的学习。他们担心,如果这种AI驱动的研究变得根深蒂固,较老的方法将被"一种无意义的竞争所淘汰"。
尽管这些都是真实存在的问题,也是理解AI之前报道过的问题,但我认为它们并不影响AI地震检测的成功。在过去的五年里,基于AI的工作流程已经几乎完全取代了地震学中的一个基础任务,而且是为了更好的目的。
这相当酷。
未来展望
尽管AI在地震检测方面取得了显著成功,但地震学领域仍有广阔的探索空间。地震预测仍然是该领域的终极目标,尽管目前AI技术尚未实现这一突破。
随着计算能力的提升和更多高质量地震数据的积累,AI模型有望在地震学中发挥更重要的作用。未来的研究方向可能包括:
更精确的地震预测模型:虽然目前的AI模型在检测已发生的地震方面表现出色,但预测未来地震的能力仍然有限。
多模态数据融合:结合地震数据与其他地球物理数据(如地磁、重力场变化等),提高对地球内部结构的理解。
实时地震监测系统:开发基于AI的实时监测系统,能够在地震发生后几秒内发出预警。
个性化风险评估:利用AI分析历史地震数据和地质特征,为特定地区提供更精确的地震风险评估。
地震学正站在一个新时代的门槛上,AI技术不仅改变了我们研究地震的方式,还可能最终帮助我们更好地应对这一自然灾害。正如布拉德利所言,这就像是"第一次戴上眼镜",让我们能够以前所未有的清晰度观察地球的脉动。