在2008年1月1日凌晨1点59分,加利福尼亚州卡利帕特里亚发生了一次地震。你可能从未听说过这次地震,即使当时你正住在卡利帕特里亚,也感觉不到任何震动。这次地震的震级为-0.53,大约相当于一辆卡车驶过时的震动程度。尽管这次地震规模不大,但它之所以引人注目,正是因为它极其微小——而我们却能够探测到它。
过去七年中,基于计算机视觉的AI工具几乎完全自动化了地震学的一项基本任务:地震检测。这项任务曾经由人类分析师完成,后来由更简单的计算机程序接手,现在则可以通过机器学习工具快速自动完成。
这些机器学习工具能够检测到人类分析师难以发现的微小地震,尤其是在城市等嘈杂环境中。地震提供了关于地球组成和未来可能发生的灾害的宝贵信息。
"在最佳情况下,当你采用这些新技术时,即使使用相同的老数据,也像是第一次戴上眼镜,你可以看到树上的叶子,"《地震洞察》通讯的合著者Kyle Bradley说道。
我采访了几位地震科学家,他们都一致认为机器学习方法在这些特定任务上已经取代了人类,并且做得更好。
"这真的令人惊叹,"康奈尔大学教授、Bradley的合著者Judith Hubbard告诉我。
不太确定的是接下来会发生什么。地震检测是地震学的基础部分,但许多其他数据处理任务尚未被颠覆。最大的潜在影响,一直到地震预测,尚未实现。
"这确实是一场革命,"德克萨斯大学达拉斯分校的Joe Byrnes教授说。"但这场革命仍在继续。"
地震学家的工作
当某地发生地震时,震动会穿过地面,类似于声波穿过空气的方式。在这两种情况下,都可以推断出波穿过的材料特性。
想象一下敲击墙壁以判断它是否是空心的。因为实心墙壁和空心墙壁的振动方式不同,你可以通过声音判断结构。
地震也是如此。地震波以不同方式穿过不同材料(岩石、石油、岩浆等),科学家利用这些振动来成像地球内部。
科学家传统使用的主要工具是地震仪。这些设备记录地球在三个方向上的运动:上下、南北和东西。如果发生地震,地震仪可以测量特定位置的震动。
传统的物理地震仪。如今,地震仪以数字方式记录数据。图片来源:Yamaguchi先生 on Wikimedia CC BY-SA 3.0
然后,科学家处理原始地震仪信息以识别地震。
地震会产生多种类型的震动,它们以不同的速度传播。两种类型——初级(P)波和次级(S)波——尤其重要,科学家喜欢识别每种相位的开始时间。
机器学习出现前的地震检测
在良好的算法出现之前,地震目录必须手动完成。Byrnes说,"传统上,像美国地质调查局这样的实验室会有大量本科生或实习生队伍查看地震图。"
然而,手动可以找到和分类的地震数量有限。开发有效查找和处理地震的算法一直是该领域的优先事项——特别是在20世纪50年代初计算机出现后。
"地震学领域的历史发展一直随着计算技术的进步而进步,"Bradley告诉我。
然而,传统算法面临一个重大挑战:它们难以找到较小的地震,尤其是在嘈杂的环境中。
常见事件的复合地震图。注意每个事件都有略微不同的形状。图片来源:EarthScope Consortium CC BY 4.0
如上所示的地震图所示,许多不同的事件都可能引起地震信号。如果一种方法过于敏感,它可能会错误地将事件检测为地震。这个问题在城市中尤其严重,那里持续不断的交通和建筑噪音可能会淹没微小地震。
然而,地震具有特征性的"形状"。例如,震级7.7的地震看起来与直升机降落截然不同。
因此,科学家们的一个想法是从人工标记的数据集中创建模板。如果新波形与现有模板高度相关,那么它几乎肯定是地震。
如果你有足够多的人工标记示例,模板匹配效果非常好。2019年,加州理工学院Zach Ross的实验室使用模板匹配在南加利福尼亚发现了比先前已知多10倍的地震,包括本文开头提到的地震。他们发现的几乎所有160万新地震都非常小,震级在1级以下。
然而,如果你没有大量预先存在的模板数据集,就无法轻松应用模板匹配。这在南加利福尼亚不是问题——那里已经有基本完整的1.7级以下地震记录——但在其他地方却是一个挑战。
此外,模板匹配计算成本高昂。使用模板匹配创建南加利福尼亚地震数据集需要200个Nvidia P100 GPU连续运行数天。
必须有更好的方法。
地震变换器的突破
AI检测模型解决了所有这些问题:
- 它们比模板匹配更快。
- 因为AI检测模型非常小(约350,000个参数,与GPT4.0等LLM的数十亿参数相比),它们可以在消费级CPU上运行。
- AI模型能够很好地推广到原始数据集中未表示的区域。
作为额外优势,AI模型可以提供关于不同类型地震震动到达时间的更好信息。两种最重要波到达时间的确定称为相位拾取(phase picking)。它使科学家能够推断地震的结构。AI模型可以在地震检测的同时完成这项工作。
地震检测(和相位拾取)的基本任务如下所示:
地震变换器 cropped图——一个用于同时地震检测和相位拾取的深度学习 attentive 模型。图片来源:Nature Communications
前三行代表不同的振动方向(东西、南北和上下)。给定这三个振动维度,我们能否确定是否发生了地震,以及何时开始?
我们想要检测初始的P波,它直接从地震源点传播而来。但这可能很棘手,因为P波的回声可能会从其他岩层反射并稍后到达,使波形更加复杂。
理想情况下,我们的模型在样本的每个时间步输出三个内容:
- 在该时刻发生地震的概率。
- 第一条P波在该时刻到达的概率。
- 第一条S波在该时刻到达的概率。
我们在第四行看到了所有三个输出:绿色的检测信号、蓝色的P波到达信号和红色的S波到达信号。(这个样本中有两次地震。)
为了训练AI模型,科学家们获取大量标记数据,如上图所示,并进行监督训练。我将描述最常用的模型之一:地震变换器(Earthquake Transformer),该模型由斯坦福大学团队在2020年左右开发,由S. Mostafa Mousavi领导,他后来成为哈佛大学教授。
与许多地震检测模型一样,地震变换器采用了图像分类的想法。读者可能熟悉AlexNet,这是一个著名的图像识别模型,在2012年引发了深度学习热潮。
AlexNet使用了卷积(convolutions),这是一种基于物理上接近的像素更可能相关的想法的神经网络架构。AlexNet的第一层卷积将图像分解成小块——每边11个像素——并根据边缘或梯度等简单特征的存在对每个块进行分类。
下一层将第一层的分类作为输入,检查更高级别的概念,如纹理或简单形状。
每个卷积层分析图像的更大部分,并在更高的抽象层次上操作。在最后的层中,网络正在查看整个图像并识别"蘑菇"和"集装箱船"等物体。
图像是二维的,因此AlexNet基于二维卷积。相比之下,地震图数据是一维的,因此地震变换器使用时间维度上的一维卷积。第一层分析0.1秒的振动数据块,而后续层在逐渐更长的时间段内识别模式。
很难说地震模型具体提取了什么模式,但我们可以将其类比为使用一维卷积的假设音频转录模型。该模型可能首先识别辅音,然后是音节,然后是单词,然后是句子,时间尺度逐渐增大。
地震变换器将原始波形数据转换为一系列高级表示,这些表示指示地震和其他地震学重要事件的可能性。随后是一系列反卷积层,精确定位地震及其至关重要的P波和S波发生的时间。
该模型还在模型中间使用了一个注意力层,用于混合时间序列不同部分的信息。注意力机制在大型语言模型中最著名,它有助于在单词之间传递信息。它在地震图检测中扮演类似角色。地震地震图具有一般结构:P波后跟S波,然后是其他类型的震动。因此,如果某个片段看起来像P波的开始,注意力机制有助于它检查它是否符合更广泛的地震模式。
扩展地震数据
地震变换器的所有组件都来自神经网络文献的标准设计。其他成功的检测模型,如PhaseNet,甚至更简单。PhaseNet仅使用一维卷积来拾取地震波的到达时间。没有注意力层。
一般来说,根据Byrnes的说法,"在地震学领域没有太多需要发明新架构的必要"。从图像处理技术中提取的技术已经足够。
那么,这些通用架构为何如此有效?数据。大量数据。
Ars之前曾报道过ImageNet(一个图像识别基准)的引入如何帮助引发深度学习热潮。大型公开可用的地震数据集在地震学中发挥了类似作用。
地震变换器使用**斯坦福地震数据集(STEAD)**进行训练,该数据集包含来自全球的120万个人类标记的地震图数据段。(STEAD的论文明确提到了ImageNet作为灵感来源)。其他模型,如PhaseNet,也在数十万或数百万个标记段上进行了训练。
斯坦福地震数据集中的所有记录地震。图片来源:IEEE (CC BY 4.0)
数据和架构的组合效果很好。根据Byrnes的说法,当前的模型在识别和分类地震方面"好得令人难以置信"。通常,机器学习方法在一个区域发现的地震数量是先前识别的10倍或更多。你可以在意大利的地震目录中直接看到这一点:
来自Beroza等人的《机器学习与地震预测——下一步》。图片来源:Nature Communications (CC-BY 4.0)
AI工具不一定比模板匹配检测到更多地震。但基于AI的技术在计算和劳动密集度方面低得多,使普通研究项目更容易使用,也更容易在世界各地应用。
总的来说,这些机器学习模型非常好,它们几乎完全取代了传统的地震检测和相位拾取方法,特别是对于较小震级的地震。
AI在地震学中的实际应用
地震科学的圣杯是地震预测。例如,科学家知道西雅图附近将发生大地震,但几乎无法知道它明天还是一百年后会发生。如果我们能够精确预测地震,以便让受影响地区的人们撤离,那将非常有帮助。
你可能认为AI工具有助于预测地震,但这似乎尚未实现。
康奈尔大学的Judith Hubbard表示,应用更加技术性,也不那么花哨。
更好的AI模型为地震学家提供了更全面的地震目录,这解锁了"许多不同的技术",Bradley说。
最酷的应用之一是理解和成像火山。火山活动产生大量小地震,这些地震的位置帮助科学家理解岩浆系统的结构。在2022年的一篇论文中,John Wilding及其合作者使用大型AI生成的地震目录创建了夏威夷火山系统的惊人图像。
每个点代表一个单独的地震。图片来源:Wilding et al., The magmatic web beneath Hawai'i.
他们提供了先前假设的深部Pāhala岩浆复合体与莫纳罗亚浅部火山结构之间岩浆连接的直接证据。你可以在图像中看到这一点,标记为Pāhala-Mauna Loa地震带的箭头。作者还能够将Pāhala岩浆复合体的结构细分为离散的岩浆片。这种细节水平可能促进更好的地震实时监测和更准确的喷发预测。
另一个有前景的领域是降低处理大数据集的成本。**分布式声学传感(DAS)**是一种强大的技术,它使用光纤电缆测量电缆全长范围内的地震活动。根据休斯顿大学教授Jiaxuan Li的说法,单个DAS阵列每天可以产生"数百GB的数据"。这些数据可以产生极高分辨率的数据库——足以分辨出单个脚步声。
AI工具使得在DAS数据中非常精确地确定地震时间成为可能。在DAS数据中引入相位拾取的AI技术之前,Li和他的一些合作者尝试使用传统技术。虽然这些技术"大致有效",但对于他们的下游分析来说不够准确。没有AI,他的许多工作将会"困难得多",他告诉我。
Li也乐观地认为,未来AI工具将能够帮助他在丰富的DAS数据中分离出"新型信号"。
并非所有AI技术都取得成功
与许多其他科学领域一样,地震学家面临着采用AI方法的压力,无论这些方法是否与他们的研究相关。
"学校希望你把AI这个词放在一切前面,"Byrnes说。"这有点失控了。"
这可能导致技术上正确但实际上无用的论文。Hubbard和Bradley告诉我,他们看到许多基于AI技术的论文"揭示了对地震工作原理的根本误解"。
他们指出,研究生可能会感到压力,专门学习AI方法,而牺牲对科学领域基础知识的了解。他们担心,如果这种AI驱动的研究变得根深蒂固,旧方法将被"一种无意义的方式所超越"。
虽然这些问题是真实的,Understanding AI之前也曾报道过,但我认为它们并不影响AI地震检测的成功。在过去的五年中,基于AI的工作流程几乎完全取代了地震学中的一项基本任务,而且效果更好。
这相当酷。
地震学AI的未来展望
地震学AI的发展仍然处于早期阶段,但已经显示出巨大的潜力。随着计算能力的提升和算法的优化,我们可以期待更多突破性应用。
地震预测的突破
尽管目前AI尚未实现精确的地震预测,但这一领域正在取得进展。通过分析地震前兆信号、地壳应力变化和地下流体运动等数据,AI模型可能能够识别出人类难以察觉的模式。未来的地震预测系统可能会结合多种AI模型,提高预测的准确性和时间窗口。
实时地震监测网络
随着AI处理能力的提升,我们可以构建更密集、更智能的地震监测网络。这些网络将能够实时分析来自数千个传感器的数据,在地震发生后几秒内提供精确的位置、震级和潜在影响评估,为应急响应提供关键信息。
地球内部结构成像
AI不仅可以帮助检测地震,还可以通过分析地震波穿过地球内部的方式,创建更精细的地球内部结构图像。这将帮助我们更好地理解板块构造、地幔对流和地核动力学等基本地球科学问题。
跨学科应用
地震学AI技术可以应用于其他领域,如火山监测、冰川活动研究、甚至行星科学。通过适应不同的环境和信号特征,AI模型可以帮助科学家探索地球以外的天体,如火星和月球的地震活动。
伦理与挑战
随着AI在地震学中的应用扩大,我们也需要考虑相关的伦理问题。如何平衡技术进步与科学严谨性?如何确保AI模型的透明度和可解释性?如何防止技术被用于不当目的?这些问题需要科学家、政策制定者和公众共同思考。
结语
AI在地震学中的应用已经从简单的检测工具发展为复杂的分析系统,不仅改变了我们研究地震的方式,也扩展了我们对地球内部活动的理解。从微小地震的检测到火山结构的成像,AI正在开启地球科学研究的新篇章。
然而,技术只是工具,真正的突破来自于科学家如何利用这些工具提出新问题、探索未知领域。随着AI技术的不断发展,我们可以期待地震学领域出现更多令人兴奋的发现,为人类更好地理解和应对自然灾害提供科学基础。
这场由AI驱动的地震学革命仍在继续,而我们才刚刚开始探索它的全部潜力。