2025年8月12日火曜日

S波速度構造の推定と機械学習

 Surface wave dispersion curve inversion using mixture density networks | Geophysical Journal International | Oxford Academic

AI要約

目的と背景
浅部S波速度構造の迅速・高精度な推定は耐震・地盤工学などで重要。従来の分散曲線逆解析(線形・大域探索・ベイズ)は、局所解・計算量・不確実性評価・層数/厚さ固定などの課題がある。

提案手法(2ステップML)
ステップ1:分類NNで上部100 mの層数(2–7層+半無限層)を推定。
ステップ2:Mixture Density Network(MDN)で層境界深さ(決定論的出力)と各層S波速度の確率分布(混合ガウス10個)を同時推定。Love・Rayleigh基本モードの分散曲線(1–20 Hz)と各周波数点の不確かさを入力。

学習データと前処理
2–7層モデルで上部100 mをパラメタ化。最上層Vsは100–500 m/sで最小厚さ5 m、以深はVs∈[Vtop+100,1600] m/sで最小厚さ10 m、半無限層はVs∈[max(v)+200,2000] m/s、境界深さ最大85 m。P波速度と密度は経験式で付与(Vp=1.16Vs+1.36、ρ=1.74Vp^0.25)。
gplivemodelでLove/Rayleigh分散曲線を計算し、1–20 Hzで100点に対数再サンプル。0–5%の一様ノイズを加え、同時に不確かさベクトルuを作成し入力に含める。標準化後、学習/検証=90/10に分割。
各層数ごとにMDNを個別学習(出力次元は(層数+2)×10)。平均推定は事後分布の最大値を採用。ハイパーパラメータはHyperopt系で探索。

性能評価(合成データ)
層数分類:未学習4000モデルで正答>60%、±1の誤差が約30%、相関係数r=0.90。中間層数(4–6層)の識別がやや難しい。
MDNのVs・深さ推定:2–4層で高相関(各層r>0.84、深さr>0.80)。5–7層では深部ほど相関低下(Vs 0.62–0.87、深さ0.29–0.67)。半無限層Vsは全体で高相関(r>0.84)。
代表例:3層では狭い事後分布で真値に近い。7層では混合核の多峰性が現れ、曖昧性を示すが大筋で整合。

従来法との比較(合成データ)
比較対象:GEOPSY DINVER(近傍算法NA)とベイズMcMC(Alder et al. 2021 実装)。パラメータ空間は最大7層、Vs=100–2000 m/sに整合。
2層モデル:分類は正解、MDNは深さ・Vsとも真値に近く、推定は1秒程度。NAも良好(約30秒/1万モデル)。McMCも良好だが約2 CPU時間/20万モデル。
5層モデル:MDNは平均値が真値に近く、深さ誤差<5 m、推定は1秒程度。NAは目標適合は良いが真の構造から逸脱(層境界の位置ずれ・深部不解像)、約60秒/3万モデル。McMCは大筋整合、約7 CPU時間/50万モデル。

実データ適用(ミュンヘン)
市内L字配列(辺100 m、4.5 Hzセンサー11台、2時間観測)。HRFKで1–20 HzのLove/Rayleigh分散曲線を抽出。
分類は5層、MDNの結果は5 m付近で速度段差、その後は圧密によると考えられる速度勾配。水位・堆積物境界(GeoPot水文地質3Dモデルの砂→粘土)と整合し、20 m付近の層境界とも概ね対応。

ロバスト性検証
学習外の滑らかな速度勾配(200→1800 m/s)に対して、分類は最大の7層、MDNは構造を再現。順解析の分散曲線は入力に近く、非一意性を示唆。
低周波欠測(1–3 Hzのギャップ)を4種の外挿で補完し、不確かさを大きく設定。分類結果は3–4層に分かれたが、MDNの事後分布を平均すると浅部構造と浅い層境界は安定。30–60 mで差異が出るが最大確率は真値に近い。
深部解像度の限界例として、深部の薄い低速度層(厚さ10–30 m)の感度テストでは、10 mではノイズ下で識別困難、20 mで差がやや現れ、30 mで明瞭。深部ほど最小可探厚が増すことを示唆。

議論・利点と限界
利点:層数を固定せずに分類し、Vsの事後分布と層深さを同時に高速推定。学習後の推論は秒オーダーで、多点・多次元適用に有利。複雑構造に対しNAより高精度、McMCに近い結果を高速に得られる。
限界:深部の解像度低下と非一意性により、層数中間域の分類や深い層境界の推定は不確かさが増大。MDNは事前サンプル型で、観測近傍のサンプル密度が低い場合、McMCより事後分布が広くなる可能性がある。ただし最尤近傍は真値に近い。
実務上の注意:1–20 Hzの広帯域データが望ましい。欠測は外挿+大きな不確かさ付与で平均化戦略が有効。7層以上の極薄層は本帯域では解像困難。
将来展望:H/V比の併用、上位モード導入、説明可能AIの活用が精度・解釈性向上に有望。

 層数を指定することなく、層境界深さ・Vsの確率分布を同時に推定できる、しかも機械学習なので高速というのは従来法に比べて有利で理想的です。データを作って教師データとするのもうまいと思います。学習時の不確かさの作り方は書かれていますが、実データでどう定量化したかは書かれていません。コードを追わないとわからないのかな。


0 件のコメント:

コメントを投稿