2023-04-22
由于高频地震波受传播路径影响大,固定台网记录的低震级地震(M<3.0)的震源参数求解仍然困难,因此地震事件分类方法一般是从地震记录中提取识别特征。单一特征的缺陷是分类能力的稳定性及普适性较差,因而多特征综合的人工智能方法在地震分类中得到了广泛的应用。近些年提出的极限梯度提升算法(Extreme Gradient Boosting, XGBoost)算法,是一种设计效率高、适用性强的新型提升决策树算法,已应用于不同领域,但在地震学研究中的应用较少,值得进一步探索。
中国地震局地球物理研究所王婷婷助理研究员针对地震、爆炸与矿震的分类问题,基于时频域地震记录,量化提取了幅值比、高低频能量比、拐角频率、持续时间、复杂度、过零率、倒谱复杂度、瞬时频率复杂度等8类36个特征,建立了特征提取数据集(图1);作为对比,利用多窗口谱分析对地震记录建立了201维波形谱数据集;利用XGBoost方法分别构建了地震/爆炸、地震/矿震、爆炸/矿震的两分类与三分类模型(图2),通过混淆矩阵、ROC等指标对比了基于特征提取数据集和波形谱数据集的分类能力;利用研究区域内和研究区域外数据进行了模型的泛化能力测试,并与SVM方法进行对比。本文得到特征提取方法可以突出不同类型地震事件之间的差异;分类模型的准确率均高于90%,其中地震与矿震、地震与爆炸分类准确率高于95%;泛化能力测试表明,基于特征提取数据集构建的分类模型对不同区域事件的泛化能力强;XGBoost构建的分类模型的不同性能指标均高于SVM,表明XGBoost在地震事件分类中有较好的应用前景。
图1 特征分布图,P/S幅值比(a);S拐角频率(b);高低频能量比(c);持续时间(d)
图2 地震/爆炸(a)、地震/矿震(b)、爆炸/矿震(c)、三分类(d)模型分类准确率
本研究的创新点包括:
1. 特征提取数据集与波形谱数据集,基于天然地震、人工爆炸、矿震三类地震记录的时频特征差异,量化提取了最大振幅比、高低频能量比、谱比、拐角频率、持续时间等判据,建立了36维特征提取数据集;作为模型泛化能力对比,同时基于多窗口谱分析建立了201维波形谱数据集。
2. XGBoost构建分类模型,XGBoost是Chen and Guestrin提出的新型提升决策树算法,增加了正则化项防止过拟合,支持并行计算,已应用于不同领域。本文在地震分类中引入了XGBoost方法,并与应用广泛的SVM方法进行了对比。
本文构建的地震、爆炸、矿震的两分类与三分类模型可直接应用于区域地震记录中的非天然地震分类与编目中,研究方法也可应用于矿区微震分类。一方面建立准确的天然地震目录有利于进行活断层划分、强震预测、地震危险性评估等地震学研究,另一方面,确定完整的爆炸、矿震等非天然地震目录有助于评估突发爆炸灾害以及采矿诱发地震的风险性。研究成果2022年发表于学术期刊《Computers and Geosciences》(Wang Tingting, Bian Yinju, Zhang Yixiao, et al., Classification of earthquakes, explosions and mining-induced earthquakes based on XGBoost algorithm. Computers and Geosciences, 2022,170,105242)。
【作者介绍】
王婷婷,非天然地震研究室,助研,主要从事特殊事件监测、爆炸当量估算、天然地震与非天然地震事件分类识别等研究。