AI要約
本研究は、深層学習を用いた位相速度分散曲線の自動ピックアップにおける「サンプル不適合性(sample-inadaptability)」の問題、特に訓練データと異なる地質領域のテストデータでニューラルネットワークの性能が低下する課題に取り組んだ。これは、従来の表面波トモグラフィーが基礎モードのみに依存し、非一意性と精度が低いという問題や、手動ピックアップの時間とエネルギーの消費をディープラーニングで解決しようとする中で生じたものである。
背景1:分散曲線ピッキングにおける時間と労力の課題
地質構造を正確にマッピングするためには、基本モードと上位モードの分散曲線をピッキングするのに時間を要する。従来、位相速度-周波数図からの分散曲線の手作業によるピッキングは、かなりの時間を必要とた。そのため、深層学習を用いた分散曲線の自動ピッキングが試みられていた。背景2:深層学習モデルの一般化能力の低下(サンプルへの不適応性/ドメインシフト)
深層学習を用いた自動ピッキングにおいて、ある位相速度-周波数図(トレーニングセット)で訓練されたニューラルネットワークが、トレーニングセットとは異なる地質学的領域のテスト図に対しては、その一般化能力や性能が低下するという問題が発生していた。これは「サンプルへの不適応性」と呼ばれ、コンピュータビジョンにおける「ドメインシフト」の問題と同義である。具体的には、東北中国のデータで訓練されたネットワークが、他の地質学的領域からの位相速度-周波数図(例えばアメリカのデータ)に対して性能が低下するという現象が観察された。この問題に対処するため、本研究では深層学習ベースのピックアップ手法に「ドメイン適応(domain adaptation)」ステップを導入した 。具体的には、画像処理で一般的に使用される「ガンマ変換(gamma transform)」を用いて、位相速度-周波数図の画像のコントラスト(グレーレベル分布)を変更した 。ガンマ変換により、テストデータのグレーレベル分布を訓練データに近づけることで、ニューラルネットワークの汎化性能を向上させた。
分散領域の抽出には Res-Unet++ を使用し、位相速度-周波数図はF-J変換によって取得する。F-J変換は、高次モードの分散曲線を効果的に抽出できる特徴を持っている。最終的な分散曲線の特定には「追求法(pursuit method)」が用いられる。
主な成果と利点:
ガンマ変換により画像のコントラストを増加させると(ガンマ値γを減少させると)、ニューラルネットワークはより多くの分散点を特定した。例えば、合成データにおいて、γ=1からγ=0.7に変化させることで、総計92点の分散点が追加で選択され、その平均精度は99.4%以上であった。
画像の平均グレースケール分布(MGLD)がトレーニングセットの平均MGLDに近いかそれよりも高い場合、高次モードの分散領域がより効果的に抽出された。
この手法は、転移学習や新しいニューラルネットワークの再訓練なしに、訓練されたネットワークの汎化性能を向上させるという利点がある。課題と注意点:
画像のコントラストを過度に増加させると(γを小さくしすぎると)、ニューラルネットワークがノイズなどのアーティファクトも抽出してしまう可能性があるため、適切なガンマパラメータの選択が重要である。
分散曲線のピッキングはまだ手動です。機械学習で自動化するステップ、そこで問題となるドメインシフトに対応するステップの2手遅れています。
社内の地質部門はさらに遅れています。直営で物理探査を実施していた世代のおじさん達が効率化のもと外注化を進め、技術を伝達せずに退職し、我々の世代もできる人が地質から離れてしまいました。今の若い人たちは将来どうなるのでしょう?私のチームの後輩君の一人には理論もコードも伝えているので、自力で解析できるようになっていますが、地質を知らない子ですからね。
ま、いずれにしてもドメインシフトの問題は機械学習を利用する上で避けて通れない問題です。このような取り組みがあること自体、参考になります。
0 件のコメント:
コメントを投稿