"就像第一次戴上眼镜一样"——这是地震学家们用来形容AI技术如何改变他们看待地震的方式。在过去七年里,基于计算机成像的AI工具几乎完全自动化了地震学的一项基本任务:地震探测。这项曾经需要人工分析师,后来由简单计算机程序完成的工作,如今可以通过机器学习工具自动且快速地完成。
传统地震探测的局限
在2008年1月1日凌晨1点59分,加利福尼亚州卡利帕特里亚发生了一次地震。你可能从未听说过这次地震,即使当时你住在卡利帕特里亚,你也不会有任何感觉。这次地震的震级为-0.53,相当于一辆卡车驶过时的震动程度。尽管如此,这次地震之所以引人注目,并非因为它规模大,而是因为它非常微小——而我们却能够探测到它。
地震学家朱迪斯·哈伯德(Judith Hubbard)表示:"在最佳情况下,当你采用这些新技术时,即使使用相同的老旧数据,也像是第一次戴上眼镜,突然能够看清树上的叶子一样。"
人工检测的挑战
在良好的算法出现之前,地震目录的编制必须手工完成。德克萨斯大学达拉斯分校的乔·伯恩斯(Joe Byrnes)表示:"传统上,美国地质调查局这样的实验室会有一支主要由本科生或实习生组成的团队,他们负责查看地震图。"
然而,手工能够找到和分类的地震数量有限。创建能够有效查找和处理地震的算法长期以来一直是该领域的优先事项——特别是在20世纪50年代初计算机出现后。
布拉德利告诉我:"地震学领域的历史发展一直与计算技术的进步同步。"
传统算法面临的一个重大挑战是:它们不容易找到较小的地震,特别是在嘈杂的环境中。在城市等地区,持续的交通和建筑物噪音可能会淹没微小的地震信号。
模板匹配的尝试与局限
科学家们曾尝试使用模板匹配技术来解决这一问题。如果新的地震图与现有模板高度相关,那么它几乎可以确定是一次地震。
模板匹配在拥有足够多人工标记的样本时效果很好。2019年,加州理工学院扎克·罗斯(Zach Ross)的实验室使用模板匹配在南加利福尼亚发现了比先前已知的数量多10倍的地震,包括本文开头提到的地震。他们发现的近160万次新地震中,绝大多数都非常小,震级在1级以下。
然而,模板匹配存在明显的局限性:如果没有广泛预先存在的模板数据集,就难以应用该方法。这在南加利福尼亚不是问题——那里已经有基本完整的震级1.7级以下的地震记录——但在其他地区则是一个挑战。
此外,模板匹配计算成本高昂。使用模板匹配创建南加利福尼亚地震数据集需要200个英伟达P100 GPU连续运行数天。
深度学习模型:Earthquake Transformer
AI地震探测模型解决了所有这些问题:
- 它比模板匹配更快
- 由于AI探测模型非常小(约35万个参数,与GPT-4等大型语言模型的数十亿参数相比),它们可以在消费级CPU上运行
- AI模型能很好地推广到原始数据集中未代表的地区
作为额外优势,AI模型还能提供有关不同类型地震波到达时间的更准确信息。对两种最重要的波——P波和S波的到达时间进行测量称为"相拾取"(phase picking),它使科学家能够推断地震的结构。AI模型可以在地震探测的同时完成这项工作。
Earthquake Transformer是斯坦福大学团队在2020年左右开发的一种模型,由后来成为哈佛大学教授的S. Mostafa Mousavi领导。与许多地震探测模型一样,Earthquake Transformer借鉴了图像分类的思想。
技术原理
像著名的AlexNet图像识别模型一样,Earthquake Transformer使用了卷积神经网络架构。AlexNet基于这样的理念:物理上接近的像素更可能相关。AlexNet的第一层将图像分解为小块——每边11个像素——并根据边缘或梯度等简单特征对每个块进行分类。

图像是二维的,因此AlexNet基于二维卷积。相比之下,地震图数据是一维的,因此Earthquake Transformer在时间维度上使用一维卷积。第一层分析0.1秒时间段的振动数据,而后续层在逐渐更长的时间段内识别模式。
很难确切地说出地震模型提取的确切模式,但我们可以将其类比为使用一维卷积的假设音频转录模型。该模型可能首先识别辅音,然后是音节,然后是单词,然后是句子,时间尺度逐渐增加。
Earthquake Transformer将原始波形数据转换为一系列高级表示,这些表示表明地震和其他地震学重要事件的可能性。随后,一系列反卷积层精确定位地震发生的时间点及其至关重要的P波和S波。
该模型还在模型中间使用了注意力层,用于混合时间序列不同部分的信息。在大型语言模型中,注意力机制最著名,它有助于在单词之间传递信息。在地震图检测中,它扮演着类似的角色。地震地震图具有一般结构:P波后跟S波,然后是其他类型的震动。因此,如果一个片段看起来像是P波的开始,注意力机制有助于它检查它是否符合更广泛的地震模式。
数据驱动:地震学领域的ImageNet
所有Earthquake Transformer的组件都来自神经网络文献中的标准设计。其他成功的探测模型,如PhaseNet,甚至更简单。PhaseNet仅使用一维卷积来拾取地震波的到达时间,没有注意力层。
伯恩斯表示,一般来说,地震学领域"没有太多需要发明新架构的必要"。从图像处理衍生出的技术已经足够。
那么,是什么使这些通用架构如此有效呢?数据。大量的数据。
斯坦福地震数据集(STEAD)包含来自全球的120万个人类标记的地震图数据段,Earthquake Transformer就是使用该数据集进行训练的。其他模型,如PhaseNet,也在数十万或数百万个标记段上进行了训练。

数据与架构的结合产生了效果。伯恩斯表示,当前的模型在识别和分类地震方面"好得令人难以置信"。通常,机器学习方法在一个区域发现的地震数量是先前识别数量的10倍或更多。您可以直接在意大利地震目录中看到这一点。
AI工具不一定比模板匹配检测到更多地震。但基于AI的技术计算和人工成本要低得多,这使得它们对普通研究项目更易访问,也更容易在世界各地应用。
AI在地震学中的应用
地震科学的圣杯是地震预测。例如,科学家们知道在西雅图附近会发生大地震,但无法确定它是在明天还是一百年后发生。如果我们能够精确预测地震,这将有助于让受影响地区的人们撤离。
您可能会认为AI工具有助于预测地震,但似乎尚未实现。
康奈尔大学的朱迪斯·哈伯德表示,应用更加技术性,不那么引人注目。
更好的AI模型为地震学家提供了更全面的地震目录,这解锁了"许多不同的技术",布拉德利说。
火山成像
最酷的应用之一是理解和成像火山。火山活动产生大量小地震,其位置有助于科学家了解岩浆系统的结构。在2022年的一篇论文中,约翰·威尔丁(John Wilding)及其合作者使用大型AI生成的地震目录创建了夏威夷火山系统结构的令人难以置信的图像。

每个点代表一次单独的地震。他们提供了之前假设的深部帕哈拉岩浆复合体与茂纳罗亚浅层火山结构之间岩浆连接的直接证据。您可以在图像中看到标有"帕哈拉-茂纳罗亚地震活动带"的箭头。作者还能够将帕哈拉岩浆复合体的结构澄清为离散的岩浆片。这种细节水平可能促进更好的实时地震监测和更准确的喷发预测。
分布式声学传感(DAS)
另一个有前景的领域是降低处理大型数据集的成本。分布式声学传感(DAS)是一种强大的技术,它使用光纤电缆测量沿整个电缆长度的地震活动。休斯顿大学的李家轩(Jiaxuan Li)教授表示,单个DAS阵列每天可以产生"数百GB的数据"。这些数据可以产生极高分辨率的数据集——足以分辨出单个脚步声。
AI工具使得在DAS数据中非常精确地计时地震成为可能。在DAS数据中引入AI相拾取技术之前,李和他的一些合作者尝试使用传统技术。虽然这些技术"大致有效",但对于他们的下游分析来说不够准确。他告诉我,没有AI,他的许多工作将会"困难得多"。
李也乐观地认为,AI工具将来能够帮助他在丰富的DAS数据中分离出"新型信号"。
AI应用的反思与局限
正如许多其他科学领域一样,地震学家面临着采用AI方法的压力,无论这些方法是否与他们的研究相关。
"学校希望你把AI这个词放在一切前面,"伯恩斯说。"这有点失控了。"
这可能导致技术上合理但实际上无用的论文。哈伯德和布拉德利告诉我,他们看到了许多基于AI技术的论文,这些论文"揭示了人们对地震工作原理的根本误解"。
他们指出,研究生可能感到压力,需要专门学习AI方法,而牺牲了学习该科学领域基础知识的机会。他们担心,如果这种AI驱动的研究变得根深蒂固,较老的方法将被"一种无意义的竞争所淘汰"。
结论:地震学的AI革命
尽管存在这些问题,但我不认为这削弱了AI地震探测的成功。在过去的五年里,基于AI的工作流程已经几乎完全取代了地震学中的一项基本任务,并且是朝着更好的方向。
这相当酷。
地震探测只是AI在地球科学中应用的开始。随着技术的进步,我们可以期待看到更多创新应用,从改进地震预测模型到开发新的监测技术。AI不仅改变了我们检测地震的方式,还改变了我们理解地球内部动态的方式,为科学家提供了前所未有的洞察力。
然而,正如地震学家们所强调的,技术本身并不是目的。真正的价值在于如何将这些工具与科学理解相结合,以解决实际问题,无论是减轻自然灾害风险还是更好地了解我们星球的运作方式。
未来,随着AI技术的进一步发展和更多高质量地震数据的积累,地震学领域可能会迎来更多突破。但关键是要保持科学严谨性,确保技术应用建立在坚实的理论基础之上,而不是盲目追随技术潮流。









