2026年3月22日日曜日

文献:Machine learning for drill core image analysis

Machine learning for drill core image analysis: A review - ScienceDirect

AI要約

1. はじめに:鉱物探査におけるドリルコアの重要性と機械学習の台頭
世界的な原材料需要の増加、特に再生可能エネルギーへの移行に伴う戦略的原材料の確保が急務となる中、鉱物探査プロセスの効率化が求められています。ドリルコアは、地下の地質状態を物理的に保存した最も直接的な記録であり、その解析(ロギング)は探査の根幹をなします。
近年、このドリルコア写真をデジタルデータとして機械学習(ML)で解析する試みが急速に進化しています。ドリルコア写真は、低コストかつ迅速に撮影可能で、岩相、変質、鉱物、層序、地盤工学的特徴といった多様な視覚的指標を保存しているため、MLの入力データとして非常に魅力的です。

2. 機械学習が取り組む3つの主要な地質学的タスク

① 岩相予測(Lithology Prediction)
岩石の種類(砂岩、大理石、玄武岩など)を分類するタスクで、最も研究が進んでいます。
手法と精度: 畳み込みニューラルネットワーク(CNN)が主流であり、ResNetやGoogLeNetなどのアーキテクチャを用いた研究では、90%から96.7%という極めて高い正解率が報告されています。
技術的アプローチ: 多くの場合、ImageNetで学習済みのモデルをドリルコアデータで微調整する「転移学習」が用いられます。
課題: 砂岩と石灰岩のように視覚的に酷似した岩石の判別には限界があり、人間による化学テスト(塩酸反応など)を代替するには至っていません。

② 地盤工学的解析(RQD/FS推定)
岩盤の品質指標(RQD)や亀裂間隔(FS)を推定するタスクです。
成果: モデルによる推定誤差は手動測定に対して±2.5〜3%以内に収まり、処理速度は人間の約1800倍に達する可能性があるとされています。
汎用性: 亀裂や破砕帯といった構造的特徴は、岩石の種類よりも普遍的なパターンを持つため、最も自動化や汎用化に適した領域と考えられています。

③ 鉱物予測(Mineralogical Prediction)
画像テクスチャ(質感)から特定の鉱物の含有量や品位を推定します。
手法: 従来のテクスチャ記述子(LBPやGLCMなど)を用いる手法と、CNNを用いる手法があります。
複雑性: 鉱物学的性質は微視的なスケールで決定されることが多いため、画像というマクロな視覚情報から推測するこのタスクは、3つの中で最も抽象度が高く困難です。

3. 技術的・実務的な主要課題と議論
研究レベルでの高精度とは裏腹に、実務への完全導入にはいくつかの大きな壁が存在します。

汎用化の壁(Generalization): ある現場で学習したモデルを別の現場や地域に適用すると、精度が著しく低下します。これは、同じ岩相でも地域によって見え方が異なるためです。
データの一貫性と主観性: 地質学者が作成する「正解ラベル」自体に主観が含まれており、専門家間でのラベル不一致(label non-agreement)がモデルの学習を阻害しています。
データの不均衡: 自然界では特定の岩相や希少鉱物は少なく、データが偏っているため、稀なケースをAIが学習しにくいという本質的な問題があります。
スケールの不一致: AIが数ミリ単位で予測を行うのに対し、地質学的な解釈はメートル単位の連続性を重視します。このギャップを埋めるための「予測結果の平滑化(smoothing)」などの後処理が重要視されています。

4. 将来展望:自動化から「コンテキスト認識型アシスタント」へ
ヒューマン・イン・ザ・ループ(HITL): AIが予測を行い、不確実な箇所のみを人間が修正し、その結果をAIが再学習する「地質学者・イン・ザ・ループ」のサイクルが提案されています。これにより、現場固有の文脈(コンテキスト)を効率的にモデルに教え込むことができます。
コンテキスト認識: 空間的な地質モデルや層序学的な知識をMLの制約条件として統合することで、「古い岩石の上に若い岩石があるのは不自然」といった地質学的妥当性を持った予測が可能になります。
ベンチマークの必要性: 異なるモデルを公平に比較するため、多様な地質環境を網羅した「標準的なデータセット群(ベンチマーク・スイート)」の構築が提案されています。

結論として、機械学習は地質学者の仕事を奪うものではなく、解釈の矛盾を指摘したり、膨大なルーチンワークを高速化したりする「高度な助手」へと進化していくことが期待されています。

ルレオ工科大学(スウェーデン)の研究者を中心とし、スウェーデンの大手鉱業企業であるBoliden Mines の実務家が加わった、学術界と産業界の多角的な専門家チームによって執筆されています。レビューなので新たな知見や目新しい手法がないのは仕方ありませんが、それでもHITLの方針はやや残念。いえ、私も(手を抜いて)失敗しましたし、現状では納得なのですが、この壁を破る必要があります。ま、要素ごとに解決して組み合わせる、いずれ丸っとログを吐かせるなどの手法は時間の問題でしょう。
https://phreeqc.blogspot.com/2025/04/blog-post.html

さらに、TBMのようにボーリングマシンでもデータをとれるような仕組みを考え、そのデータを柱状図作成用の機械学習モデルに取り込み、3次元地質モデルを推定させる段階までは、近い将来可能でしょう。要素技術としては既に存在するため、難しくはないと思います。

国内ではこのようなコアに対する機械学習モデルやデータセットを公開しようといった動きを聞きませんし、機械学習自体を使えない技術者たちが Executives になりつつあるため、当面は遅れたままでしょう。ビジネスチャンスではあるので、フットワークの軽い企業は文献に紹介されているような要素技術を商品として宣伝を始めるでしょう。そういった企業がやがて地質の機械学習に関する老舗となり、時代が追い付いた段階でに優位に立てるのかもしれません。


2026年3月21日土曜日

文献:Automated classification of drill core photographs

Automated classification of drill core photographs: A complete workflow for weakly supervised training - ScienceDirect

AI要約

1. 背景
鉱物探査において、地質学者がコアを視覚的に検査することは伝統的な手法ですが、分類が部分的で主観的になりやすく、専門家によって結果が異なるという課題があります。近年、深層学習(CNNなど)を用いた自動予測が注目されていますが、学習に必要な大量のラベル付きデータを作成するには多大な時間と労力が必要です。本研究は、最小限のラベル付けで効率的に岩石を分類できる完全なワークフローを構築することを目的としています。

2. 手法
本手法は、以下の5つの手順で構成されています。

前処理 (Preprocessing)
レンズ歪み補正: 広角レンズによる「樽型歪み」を補正し、その後の直線検出の精度を高めます。
コア箱の分離: 木製のコア箱から岩石コア部分を分離するため、Cannyエッジ検出やモルフォロジー演算(膨張、収縮、オープニングなど)を用います。
細分化 (Slicing): 分離されたコア画像を、解析に適した標準的なサイズ(300×60ピクセル、実寸約18cm長)に分割します。

機械学習手法

自己組織化マップ(SOM)によるクラスタリングとラベル付け
SOMは、高次元のデータを視覚的に理解しやすい低次元(通常は2次元)の格子状マップに変換する「トポロジー保持型」の無向ニューラルネットワークです。
仕組みと構造: 抽出された96個の特徴量(色記述子48個、テクスチャ記述子48個)を入力として使用します。これを10×10(合計100個)のニューロン格子に投影します。
トポロジーの保存: 色や質感が似ている画像は、マップ上でも物理的に近いユニットに配置されます。この性質により、数万枚の画像を1枚ずつ確認するのではなく、似た画像が集まった「クラスター」ごとに効率よく処理できます。
効率的なラベル付け: 地質学者は各ノードから代表的な画像(例:各ノードからランダムに選ばれた5枚)を確認し、そのクラスター全体に対して「漂白」や「片麻岩」といった地質学的なラベルを割り当てます。これにより、数時間という短時間で、数千から数万枚規模の学習用データセットを作成することが可能になります。

深層学習モデル:ベースラインとVGG16
ベースラインモデル (Baseline Model):
本データセットに合わせて開発されたシンプルな3層の畳み込みニューラルネットワーク(CNN)です。
構造: 3つの畳み込みブロック(サイズ32, 32, 64の3×3カーネル、ReLU活性化関数)で構成され、各層の後にバッチ正規化とマックスプーリングが適用されます。最後にソフトマックス活性化関数を持つ全結合層が配置されています。
VGG16: ImageNetデータセットで事前学習された、13層の畳み込み層と5層のマックスプーリング層を持つ非常に深く複雑なアーキテクチャです。
手法: 転移学習(Transfer Learning)のアプローチを採用し、最後の全結合層のみを今回の岩石データで訓練しました。
比較の結果: いずれの地質ドメインにおいても、複雑なVGG16よりもシンプルなベースラインモデルの方が高い精度を示しました。

半教師あり学習(Mean Teacher)
ラベル付きデータが不足している場合に、ラベルのない大量の画像を有効活用して学習の安定性と精度を高める手法です。
「生徒」と「教師」の2モデル構造: 同じ構造を持つ「生徒(Student)」モデルと「教師(Teacher)」モデルを使用します。
一貫性コスト (Consistency Cost): 同じ画像に対して、それぞれ異なるランダムなノイズ(輝度変化や反転など)を加えて両方のモデルに入力します。「滑らかさの仮定(Smoothness Assumption)」に基づき、小さな摂動(ノイズ)を加えても予測結果は変わらないはずであるため、2つのモデルの予測結果の距離(平均二乗誤差:MSE)を一貫性損失として計算し、これを最小化するように学習します。
重みの更新: 生徒モデルは通常の学習(損失関数の最小化)を行いますが、教師モデルの重みは、生徒モデルの過去の重みを指数移動平均(EMA)で反映させることで、より安定した「smoothed(平滑化された)」モデルとして機能します。
利点: 特にサンプル数が極端に少ないクラス(例:ダイアテクサイト)や、複雑な結晶質岩(基盤岩)の分類において、精度の向上に寄与しました。

説明変数 (Explanatory Variables / Features)
色情報: 3Dカラーヒストグラム(RGB空間)から抽出した512個の記述子を、主成分分析(PCA)で48個に圧縮して使用します。
テクスチャ情報: ガボールフィルタ(Gabor filters)を用いて、24通りの畳み込み演算から平均と標準偏差を算出し、計48個の特徴量を取得します。

目的変数 (Objective Variables / Target)
地質学的ドメインごとに以下のクラスを設定しています。
盆地(堆積岩): 漂白(Bleached)、部分除去(Partial removal)、ヘマタイト化(Hematized)、非コア(Non-core)。
基盤岩(結晶質岩): 片麻岩(Gneiss)、メタテキサイト(Metatexite)、ダイアテクサイト(Diatexite)、ペグマタイト(Pegmatite)、非コア。

評価関数 (Evaluation Function)
教師あり学習: カテゴリカル・クロスエントロピーを損失関数として使用します。
半教師あり学習: 教師あり損失(クロスエントロピー)と、教師モデルと生徒モデルの予測の一致度を示す「一貫性損失(MSE:平均二乗誤差)」の合計を最小化します。

3. 結果
盆地サブセット: ベースラインモデルを用いた教師あり学習で、0.932という最も高い分類精度を達成しました。
基盤岩サブセット: 半教師あり学習(Mean Teacher)を採用したベースラインモデルが0.751の精度で最高の結果となりました。
いずれのケースにおいても、複雑なVGG16よりシンプルなベースラインモデルの方が高い精度を示しました。

4. 考察
精度の差: 基盤岩の精度が盆地より低いのは、岩相の複雑さ、特定のクラス(ダイアテクサイト)のサンプル不足(40サンプル)、および変成度の変化が連続的でクラス間の境界が曖昧であるためです。
バイアスの軽減: SOMを用いたクラスタリングにより、地質学者の主観による「オペレーター・バイアス」を一貫したアルゴリズムで補完し、再現性の高い分類が可能になります。

今後の展望: 照明条件の統一や、Segment Anything Model (SAM)のような高度な画像分割手法を導入することで、さらなる精度の向上が期待されます。

まだコアを分けるという段階で、柱状図を作ることはできません。ラベリングの手間をなくすためにクラスタリングを利用するという主張はよく見ますが、経験的には正確ではない場合が多くあります。いずれも発展途中なのでしょうが、いずれ解決すると思います。


文献:Direct inversion of surface wave dispersion

Direct inversion of surface wave dispersion for three-dimensional shallow crustal structure based on ray tracing: methodology and application | Geophysical Journal International | Oxford Academic

AI要約

背景
表面波トモグラフィーは、地球の地殻や上部マントルの構造を研究する上で重要な役割を果たしてきました。従来の一般的な手法は、まず観測された走時データから2次元の位相速度(または群速度)マップを作成し、次に各地点の分散データのインバージョンにより1次元の横波(S波)速度プロファイルを求めるという、2段階のプロセスを踏みます。しかし、この手法や従来の直接反転法では、多くの場合、大圏コース(Great Circle)伝播を仮定しており、複雑な構造を持つ地殻浅部などでは、波の伝播経路の歪みが無視できず、推定結果にバイアスが生じる可能性がありました。一方で、波形全体を用いるフルウェーブフォームインバージョン(FWI)やアジョイントトモグラフィーは高精度ですが、特に高周波数帯域において計算コストが非常に高いという課題があります。

手法
本論文で提案された手法は、中間的な速度マップを作成せず、分散データから直接3次元のS波速度構造を求める単一ステップのインバージョン法です。主な特徴は以下の通りです。

Fast Marching Method( FMM) によるレイトレーシング: 各周期において、FMMを用いて震源・受信点間の走時と波の伝播経路を計算します。これにより、不均質メディアにおける大圏コースからの経路の逸脱を考慮することが可能になります。

反復的な更新: 反転プロセスにおいて、新しく得られた3次元速度モデルに基づいて、波の経路とデータ感度行列(カーネル)を逐次更新します。

ウェーブレット基底を用いた疎性制約付き反転: モデルパラメータをウェーブレット領域で表現します。ウェーブレット変換の多重解像度特性を利用し、データ制約が強い地域では高解像度を、制約が弱い地域では長波長の特徴を保持するようにします。

L1ノルム正則化: ウェーブレット係数がまばら(スパース)であると仮定し、L1 ノルム正則化を適用します。これにより、従来の滑らかさを強制する正則化よりも、データの分布に適合した適応的な解像度が得られます。

計算アルゴリズム: L1ノルムベースの最小化問題を解くために、反復再重合最小二乗法(Iteratively Reweighted Least Squares: IRLS)とLSQRアルゴリズムを組み合わせて使用しています。

物性間の関係: P波速度(α)と密度(ρ)は、地殻に関する経験的な関係式(Brocher, 2005)を用いてS波速度(β)に関連付けられており、これらによる分散への影響も感度行列に含まれています。

結果
台湾の台北盆地における、環境ノイズ相関法から抽出された短周期(0.5〜3.0秒)のレイリー波位相速度データにこの手法を適用しました。

計算の収束: 反復的な反転により、走時残差の標準偏差は1.44秒から0.91秒に減少し、残差の平均はほぼゼロになりました。

速度構造の解明: 盆地内の低速度域と山地(大屯火山群など)の高速度域が明瞭に描き出されました。これらの結果は地表の地質構造と良好に一致しています。

従来手法との比較: 従来の2段階反転法の結果と概ね一致しましたが、データ網羅性が低い地域では、本手法の方がアーティファクトが少なく、より安定した結果が得られました。

解像度テスト: チェッカーボードテストにより、データ制約が良い地域では水平・垂直方向に高い解像度を持つことが確認されました。

考察
提案手法は、計算効率と精度のバランスに優れており、特に構造が複雑な地殻浅部の調査に有効です。

利点: 2次元速度マップの構築が不要であり、3次元参照モデルの組み込みが容易です。また、ウェーブレット基底の採用により、データの密度に応じてモデルの細かさが自動的に調整されます。

限界と仮定: 現状では高周波近似(レイ理論)に基づいており、滑らかな不均質構造を想定しています。

今後の展望: 有限頻度効果(Finite-frequency effects)を取り入れた感度カーネルの導入や、実体波(P波・S波)の走時データとの共同反転(Joint Inversion)への拡張が期待されます。これにより、地殻浅部におけるP波・S波両方の速度構造をより正確に制約できる可能性があります。

こちらも、数式を追うのに時間がかかりました。パスを計算する点や、1次元のインバージョンを介さないという点が新鮮です。



2026年3月18日水曜日

文献:3D Wave‐Equation Dispersion Inversion of Distributed Acoustic Sensing Data


AI要約
3D波動方程式分散インバージョン(3D-DAS-WD)法の解析手順
3D-DAS-WD法は、DASひずみデータに直接基づく3D波動方程式分散インバージョン手法であり、ひずみ成分を速度に変換する際の数値誤差を回避し、低SNR(信号対雑音比)のDASデータにおけるFull Waveform Inversion(FWI)の収束問題に対処することを目的としています。この手法は、浅い地表付近の地質構造を高分解能で3Dイメージングする能力を示しており、地下の空洞などの特徴を効果的に特定できます。

1. DASの基本原理とデータ取得
• DASの測定原理: 従来の地震計が粒子速度を測定するのに対し、DASは光ファイバーのゲージ長に沿ったひずみ速度を測定します。

2. 初期S波速度モデルの作成
• 解析の出発点として、初期S波速度モデルを準備します。このモデルは、反復的なインバージョンプロセスを通じて改善されていきます。

3. 予測ひずみ速度DASデータの順モデリング
• 作成した初期S波速度モデルを用いて、forward modeling を実行し、予測されるひずみ速度DASデータを生成します。この研究では、スペクトル要素法に基づく弾性モデリングコードSPECFEM3Dが使用されています。
• 計算される速度成分は、式(14)および(15)を使ってDASひずみ速度成分に変換されます。

4. 観測データと予測データの分散曲線の導出
• MASW として分散曲線を作成します。
• 分散曲線は、linear Radon transform を用いて計算された分散スペクトルの最大値に基づいて抽出されます。
• この研究では、各ショットから10度間隔で分散曲線が抽出されます。

5. 目的関数の定義と勾配の計算
• 目的関数(Objective Function): 3D-DAS-WD法は、観測された波数κobs (θ,ω)と予測されたDASデータ表面波分散曲線κ(θ,ω)の二乗差の合計を最小化します。目的関数Jは以下のように定義されます: 
J = (1/2) ∑θ ∑ω (κ(θ,ω) − κobs (θ,ω))^2
ここで、θは方位角、ωは周波数です。

• S波速度に対する勾配: S波速度s(x)に対する目的関数の勾配δ(x)は、以下の式で計算されます: 
δ(x) = ∂J / ∂s(x) = ∑θ ∑ω Δκ(θ,ω) (∂κ(θ,ω) / ∂s(x))

• Fréchet 微分の導出: Fréchet 微分 (∂κ(θ,ω) / ∂s(x)) は、予測データと観測データのk-ω領域における相関を示す接続関数(connection function)Φを用いて導出されます。これは、随伴状態法(adjoint state method)を使用して計算されます。最終的にS波速度 s を λ (ラメの第一定数) と μ (剛性率) に関連付けることで、Fréchet 微分が導出されます
∂κ(θ,ω) / ∂s(x)
 = − (1/A) R{∫ ∂D(g,ω)/∂s(x) D̂*obs(g,θ,ω) dg} 
 = − (1/A) R{∫⟨GR ∂u(g,ω)/∂s(x), D̂obs(g,θ,ω)⟩ dg}
= − 4ρs (∂κ(m) / ∂λ) + 2ρs (∂κ(m) / ∂μ) 

・∂κ(m) / ∂λ、∂κ(m) / ∂μは、 波場u(m)(合成地震計データ)とバックプロパゲーションされた残差u'(D̂∗obs(g,θ,ω)をソースとする)の内積の積分として表される。

6. 速度モデルの更新
• ステップ長の決定: safeguarded backtracking line search method を用いて、モデル更新のためのステップ長αが決定されます。
• モデルの反復更新: S波速度モデルは、計算された勾配とステップ長αを用いて、steepest-descent formula により反復的に更新されます。 ここで、

7. 収束判定と最終S波速度モデルの出力
• ステップ3から6のプロセスは、目的関数が指定された誤差閾値以下になるか、または最大反復回数に達するまで繰り返されます。
• 収束条件が満たされた後、最終的なS波速度インバージョンモデルが出力されます。

さすがにAI要約のみでは理解できず、数式を追うのに時間がかかりました。
DAS(1軸センサー)を利用して、どのようにレイリー波を取り出すか、取り出した後、どのようにインバージョンをかけると精度が落ちにくいか、という内容でした。地震分野の知識の蓄積を感じる文献です。
3次元解析を目的としてファイバーをクロスで張るなら、通常のピックを使った方が楽なように感じましたが。ま、一つの方法として覚えておきましょう。

2026年3月10日火曜日

文献:Classification of Stream Hyperconcentrated and Debris Flow

Classification of Stream, Hyperconcentrated, and Debris Flow Using Dimensional Analysis and Machine Learning - Du - 2023 - Water Resources Research - Wiley Online Library

AI要約

1. 背景
山岳地帯における極端な降雨は、土石流、高濃度流、常流といった激しい土砂流動を引き起こし、人命やインフラに深刻な脅威を与えます。しかし、これらの流動メカニズムの理解は、包括的な現場データの不足により不完全な状態にありました。従来の分類基準は主に体積堆積物濃度(Cs )に基づいていましたが、研究者によってその閾値が異なり、物理的な流動特性を必ずしも正確に反映していないという課題がありました。そのため、測定可能な水理・地形学的パラメータを用いた、より普遍的で客観的な分類手法の確立が求められていました。

2. 手法
本研究では、現場観測データと機械学習を組み合わせた物理的根拠に基づく分類フレームワークが採用されています。

前処理(無次元解析): 異なる地質や地形条件を持つサイト間のデータを比較可能にするため、観測データを無次元化しました。粒子衝突、流体粘性、乱流応力などの相対的重要性を評価するため、アインシュタイン数(無次元土砂流量)、サベージ数、バグノルド数など、計11個の無次元パラメータが算出されました。

機械学習手法: 分類アルゴリズムとしてサポートベクターマシン(SVM)が使用されました。特に、対数空間での境界を定義するために、べき乗則(パワーロー)カーネル関数に相当する対数変換を用いた非線形検索アルゴリズムが採用されています。

説明変数: 流動動態を最も効果的に反映する変数として、無次元流量(q∗  )とアインシュタイン数(無次元土砂流量、qs,∗  )の2つが選択されました。

1) データの収集源
現場観測データ: 中国の蒋家溝(Jiangjia Ravine)で1960年から2014年にかけて記録された5,085件の土石流データ、および小江(Xiaojiang River)で2009年から2010年に観測された34件の常流データが使用されました。

文献データ: アジア、アメリカ、ヨーロッパ、オセアニアの41の流域から、高濃度流および常流に関する1,035件のデータが収集されました。

2) 正解ラベル(流動タイプの分類)の付与
機械学習(SVM)の学習に不可欠な「どの流動タイプか」というラベル付けは、元の観測記録や文献における専門家の知見および現場観察の結果に基づいています。本研究では、それらの既存の分類が正確であると仮定して教師データとして採用しています。

3) 特徴量の作成(無次元化処理)
収集された生の観測データ(流速、水深、川幅、勾配、粒径など)をそのまま使うのではなく、異なる地形や地質条件でも普遍的に扱えるよう、11種類の無次元パラメータへと変換されました。

4) データの活用と検証
作成されたデータセットを用いてSVMによる境界の画定が行われました。なお、ラハール(火山泥流)のデータに関しては、SVMの境界作成(学習)には使用せず、得られたモデルの妥当性を確認するための検証用データとして独立して扱われています。

目的変数: 土石流(Debris flow)、高濃度流(Hyperconcentrated flow)、常流(Stream flow)の3つです。

3. 結果
境界の定義: q∗ とqs,∗ のフェーズダイアグラムにおいて、SVMにより各流動タイプを分ける2つのべき乗則境界(上部境界UBと下部境界LB)が導き出されました。

上部境界(Upper Boundary, UB)
分類: 土石流(Debris flow)と高濃度流(Hyperconcentrated flow)を区分します。この境界より上の領域では、粒子同士の衝突応力が流動動態を支配する土石流となります。
qs,∗ =0.12q∗^1.05
精度: 真陽性率(TPrate)0.999、F1スコア0.999と、極めて高い精度で土石流を識別可能です。

下部境界(Lower Boundary, LB)分類: 高濃度流(Hyperconcentrated flow)と常流(Stream flow)を区分します。この境界より下の領域は、土砂が主に水相の剪断力や乱流によって支持・輸送される「流体支配型」の流動(常流)となります。
qs,∗ =0.07q∗^0.96
精度: 真陽性率(TPrate)0.915、F1スコア0.891であり、上部境界に比べるとわずかに分類の曖昧さが残ります。

ラハールへの適用: 火山性の土砂流動であるラハールにこのフレームワークを適用したところ、ラハールは常流から土石流まで極めて広い範囲の流動動態を示すことが確認されました。

4. 考察
輸送メカニズムの違い: 土石流は主に粒子同士の衝突応力によって制御されるのに対し、高濃度流と常流は流体の粘性剪断や乱流応力によって土砂が支えられていることが物理的に裏付けられました。
堆積物濃度基準の限界: 、従来の堆積物濃度(Cs)のみに基づく基準では動的な流動特性を無視しており、誤解を招く可能性があります。判別が困難だった領域(0.1<Cs<0.4 など)においても、流動特性を反映した明確な分類が可能となりました。
提案された無次元流量-土砂流量スキームは、水理情報をより多く取り込み、輸送メカニズムをより効果的に反映できると結論付けられています。
実用性: このフレームワークは、現場での流量や流速の測定値から即座に流動タイプを判定できるため、砂防ダムの形式選定(土石流用のスリットダムか、洪水用の不透過ダムか)など、適切な防災戦略を立てるための定量的な参考指標となります。

観測値に基づき、無次元の特徴量を作成し、機械学習にかける。Traditional な SVM ですが、解釈性を優先することで上部境界、下部境界を見出すことが可能です。検知だと最適化に陥りがちですが、ドメイン知識を有する研究者らしい機械学習の使い方で、データサイエンスと呼べるのではないでしょうか。





2026年3月9日月曜日

文献:Radar‐Based Deep Learning for Debris Flow Identification

Radar‐Based Deep Learning for Debris Flow Identification Amid the Environmental Disturbances - Liu - 2025 - Geophysical Research Letters - Wiley Online Library

AI要約

1. 背景
土石流は、山岳地帯において甚大な経済的損失や人的被害をもたらす地質災害です。
従来の監視技術には、降雨量しきい値による警戒や、地中音センサー、ビデオ監視などがありますが、これらには課題があります。例えば、小流域における降雨情報の不確実性や、機器の埋没リスク、視界の悪い夜間の監視の難しさが挙げられます。マイクロ波レーダーは、昼夜を問わず全天候型で遠隔監視が可能という利点がありますが、土石流の信号を環境ノイズの中からインテリジェントに識別する手法は十分に研究されていませんでした。本研究は、深層学習モデルとレーダー技術を組み合わせることで、複雑な環境下での土石流識別精度を向上させることを目的としています。

2. 手法
人工実験によるデータ収集: 自然な土石流の観測データが不足しているため、研究チームは中国の甘洛県にある黒西洛溝(Heixiluo Gully)などで計30セットの人工土石流実験を実施しました。
再現方法: 斜面に長さ約9メートル、勾配約15度のチャネルを掘削し、大量の緩い土砂を含む急流を作ることで、土石流の動きを徹底的にシミュレートしました。
制限事項: 実験的な土石流は「スケール効果」などの要因により、現実世界のシナリオと完全に一致させることは難しい。しかし、モニタリングと早期警戒の観点からは、人工的な土石流であってもレーダーのエコー信号を生成できるため、有効なサンプルとして使用しました。

前処理: ビデオ記録とレーダーソフトウェア(Radarexplore)のキャプチャデータに基づき、土石流や落石の移動時間範囲を特定し、異常値を手動でフィルタリングしました。その後、PythonとOpenCVライブラリを用いてビデオフレームを抽出し、各ターゲットにつき3,000個のサンプルを作成しました。深層学習モデルへの入力として、画像は短辺256ピクセルにリサイズされた後、中心部が224×224ピクセルにクロップされ、テンソルの正規化が行われました。

機械学習手法: 12種類の広く利用されている深層学習モデル(VGG16、ResNet18、GoogLeNet、Wide_ResNet50_2など)が採用されました。転移学習の考えに基づき、各モデルの事前学習済みモデルに対して30エポックの訓練が実施されました。さらに、個々のモデルの不確実性を最小限に抑えるため、多数決に基づく投票戦略(Voting Strategy)が導入されました。

説明変数: レーダー信号から変換された2次元のエネルギースペクトラム(画像データ)が説明変数として使用されました。これはドップラー周波数とエコー強度を waterfall graph 形式で可視化したものです。

本研究の waterfall graph:
横軸: 1,024の速度クラス(移動ターゲットのドップラー周波数に対応)。
縦軸: 距離ゲート(range gates)。距離情報を表すために各ゲートが積み重ねられています。
色(スケール): エコー信号の強度(信号の強さ)。
約3 Hzの頻度で出力されます。
グラフの各水平ラインは特定の時間ステップにおけるドップラー演算結果(ドップラースペクトル)に対応しています。距離ゲート(距離ごとの区切り)を垂直方向に積み重ねることで、「どの距離で、どの程度の速度の物体が、どれくらいの強さで存在するか」を一枚の画像に可視化しているため、これを waterfall graph やエネルギースペクトラムと呼んでいます。

目的変数: 以下の8つのターゲットカテゴリです:(A)水流、(B)土石流、(C)タルチョ(祈祷旗)、(D)自然の谷、(E)車両、(F)落石、(G)植生、(H)動物(ヤク)。

3. 結果
実験の結果、すべてのモデルにおいてマルチオブジェクト分類に対する高い能力が示されました。
分類精度: 個別のモデルでは Wide_ResNet50_2が最高の精度95.46%を達成しました。GoogLeNetやResNet18も95%を超える高い精度を示しました。
土石流の識別: 土石流の識別においては、VGG16が非常に優れた性能を発揮し、高い適合率と低い誤報率(false alarm rate)を記録しました。
投票戦略の効果: 投票戦略を用いることで、個々のモデルよりも信頼性が向上し、特に土石流や落石の誤検知率をさらに低減させることができました。

4. 考察
本研究は、レーダー技術と深層学習、特に豊富な実地データを組み合わせることが、土石流などの自然災害の監視と早期警戒において重要な進歩であることを示唆しています。従来の統計的な手法から、データ駆動型のモデルへの移行が有効であることが証明されました。 一方で、本研究にはいくつかの制限事項も指摘されています。まず、土石流と落石のデータは主に現地での人工的な実験によって収集されたものであり、実世界の規模(スケール効果)とは異なる可能性がある点です。また、レーダー信号を用いた土石流の移動メカニズムの解明には、さらなる詳細な実験と分析が必要であるとしています。総じて、本手法は複雑な山岳地帯における災害監視能力を大幅に強化する可能性を秘めています。

地上レーダーは高価なので、なかなか検知には利用できません。安価なレーダーは距離が不足。これも時間が解決すると思いますが。
LiDARよりも雨に左右され難いので、いずれテストを通過して検知に使われるようになるでしょう。


文献:Deep-Learning-Based Object Detection and Tracking of Debris Flows in 3-D Through LiDAR-Camera Fusion

Deep-Learning-Based Object Detection and Tracking of Debris Flows in 3-D Through LiDAR-Camera Fusion | IEEE Journals & Magazine | IEEE Xplore

 AI要約

背景
土石流は水と堆積物の混合物であり、山岳地帯で年間平均1,275人の死者を出す深刻な自然災害です。土石流の内部構造やエネルギー消散などの挙動を理解するには、流体中の個々の物体(巨石、流木、段波など)の動態を詳細に分析することが不可欠です。しかし、最新のセンサー(LiDARやビデオカメラ)は1イベントあたり約1TBもの膨大なデータを生成するため、手動での識別や追跡は極めて困難であり、リアルタイム監視や大規模データ解析のための自動化手法が強く求められていました。

手法
スイスのイルグラーベン(Illgraben)観測所にてデータを収集。画像データに対し、Label Studio(オープンソースのラベリングプラットフォーム)を使用し、専門家の監修のもとでバウンディングボックスを付与しました。

機械学習手法:
物体検出アルゴリズムとしてYOLOv5およびYOLOv8(特に複雑度の高いxバージョン)を採用しました。フレーム間の個体追跡(トラッキング)にはSORTアルゴリズムを使用しました。

説明変数:ビデオカメラ(AXIS P1448-LE)からの2次元光学画像、およびLiDAR(Ouster OS0/OS1)からの3次元点群データです。
目的変数(区分とラベル付けの判断根拠): ドメイン知識を持つ専門家が動画を確認し、物理的特性や進化状態に基づいて以下のクラスに分類・ラベル付けを行いました。

小型特徴物 (Small Features: SF): 速度プロファイルの推定を目的として区分。
巨石 (Boulders): 土石流フロント付近に集まる大きな岩。
転石 (Rolling Boulders): 流体中を転がりながら移動する岩。
流木 (Wood): 水面に浮遊し、表面速度を代表する物体。
段波 (Surge Waves: SW): 波の進化過程を分析するため、動画上の視覚的特徴から以下のように区分。
拡散型 (Diffuse): 前面が滑らかで、砕波(波の崩れ)が見られない波。
砕波型 (Breaking): 波の前面が崩れ、泡立っているような状態の波 。
ハイブリッド型 (Hybrid): 波の中央部は拡散しているが、流路の端(岸付近)で砕波している混合状態の波 。
※誤検出を防ぐため、波が含まれない画像(ネガティブ画像)も学習に含め、土石流の「フロント」を「段波」と誤認しないよう調整されています。

LiDARとビデオカメラを融合させた、土石流の3次元解析パイプライン
1. キャリブレーション(事前準備)
カメラ画像(2D)とLiDAR点群(3D)を数学的に統合するため、ターゲットベースの手法を用います。
剛体変換の算出: チェッカーボードを両方のセンサーで同時に計測し、カメラとLiDARの相対的な位置関係(回転行列と並進行列)を特定します。
歪み補正: 正確な投影を行うため、あらかじめカメラレンズの歪みを補正しておきます。

2. 2次元画像での物体検出とSORTによる追跡
まず、識別能力の高いビデオ画像(2D)側で処理を開始します。
YOLOによる検出: 深層学習モデル(YOLOv5またはv8)を用いて、画像内の巨石、流木、段波をバウンディングボックスで囲みます。
SORTアルゴリズムの役割: 検出された個々の物体に固有IDを付与し、フレーム間での同一性を維持します。これにより、単なる「点」の検出を「連続した軌跡(トラック)」として捉えることが可能になります。また、背景の誤検出は連続して追跡されにくいため、SORTが偽陽性を排除するフィルタとしても機能します。

3. 3次元投影(視錐台の形成)と位置特定
画像上の2D枠を3次元空間へ投影し、LiDAR点群と紐付けます。
視錐台(Frustum): カメラの焦点を頂点とし、2D枠の四隅を通って伸びるピラミッド状の3次元空間を定義し、その内部にある点群のみを抽出します。
高さへの対応: 位置特定にはLiDARが直接計測した3次元座標(x, y, z)を使用します。カメラ単独では「高さがある物体ほど手前に見える」という視差(パララックス)による平面位置の誤認が生じますが、本手法では点群のz座標を直接参照するため、物体の高さや形状が変化しても正確な平面位置を取得できます。

4. 物理量の自動算出
抽出された3次元データから、以下の物理量を10Hzの頻度で算出します。
位置・速度: 物体の代表点(小型特徴物はボックス中心、段波は下辺中点)の移動を時系列で計算し、3次元の速度ベクトルを導き出します。
波の幾何形状: 点群の流路横断方向における2次導関数(曲率)を計算し、値が最大となる場所を波の頂点(Crest)として特定します。この頂点と、事前に計測した河床データとの差分から、正確な波高(Hb)を算出します。

このパイプラインにより、手動計測の300倍以上のデータ量(1イベントあたり約1,000件の軌跡)を自動で取得することが可能となりました。

結果
検出精度: 段波(SW)検出器はmAP 0.9以上、小型特徴物(SF)についてもmAP 0.7以上という優れた性能を達成しました。
データ量の飛躍的向上: 自動追跡により約1,000件の物体軌跡を取得し、これは従来の手動解析の300倍以上に相当します。
労力削減: 異なる地点のデータを活用する「マルチドメイン学習」により、新しい観測地点への適応に必要なラベル付けの労力を75%以上削減できることが示されました。
科学的発見: 段波が物体を加速させる現象を定量化し、また海岸工学を応用して土石流の段波が砕ける閾値(砕波指数)が0.4であることを特定しました。

考察
モデル選定: YOLOv5は精度で僅かに勝りましたが、YOLOv8は検出速度が5倍以上速いため、リアルタイムの早期警戒システムにはYOLOv8が適している可能性があります。
追跡の役割: SORTアルゴリズムによる追跡は、背景の誤検出を排除する強力なフィルタとして機能し、解析の信頼性を高めています。
物理的挙動の解明: 流木が転石よりも速く移動する傾向の観測は、土石流内部に「剪断(深さ方向の速度低下)」が存在することを示唆する重要な知見です。
実用性: このパイプラインにより、1イベントあたり約250時間の作業時間が節約されると推定され、今後の土石流ハザード評価のスケールアップに大きく貢献します。

画像で物体を判別し、LiDARで位置を把握するという、それぞれの長所を組み合わせた手法です。1回の土石流イベントの挙動を1000の物体追跡で明らかにできるようになれば、観測に基づいた新たな理論が生まれるかもしれません。検知とは異なりますが、メカニズムの解明といった方向の研究も大事でしょう。今後が楽しみです。

文献:Deep learning-based debris flow hazard detection and recognition system

Deep learning-based debris flow hazard detection and recognition system: a case study | Scientific Reports

AI要約

背景
土石流は、突発的かつ急速に発生し、甚大な破壊力を持つため、山間部の住民やインフラにとって大きな脅威です。現在、多くの監視技術は雨量、地鳴り、土壌水分量などの自然指標に基づいていますが、センサーの設置や維持管理に多大なコストがかかるという課題があります。一方で、監視カメラは広く普及しているものの、これまでは主に事後確認用の受動的なツールとして利用されており、リアルタイムの早期警戒には活用されてきませんでした。
本研究は、ディープラーニングを用いてビデオ映像から土石流を自動的に検知・認識する能動的なシステムを構築することを目的としています。

手法
本システムは、特徴抽出、検知、認識の3段階で構成されています。

機械学習モデル:
特徴抽出ネットワーク(H-C3D): ビデオ映像から時空間的な特徴を抽出する3D CNNモデルです。土石流災害検知ネットワーク: 5層の全結合層(MLP)で構成され、ビデオの「異常性」を判定します。
土石流災害認識ネットワーク(2D CNN): 検知結果を検証するための画像レベルのCNNです。

説明変数: 監視カメラから得られる16フレーム単位の連続ビデオクリップ、およびH-C3Dによって抽出された4,096次元の特徴ベクトルです。
目的変数: 0から1の範囲の異常スコア、および最終的な判定ラベル(土石流、正常、または誤報)です。

異常スコアの算出(シグモイド関数): 検知ネットワークの最終層にシグモイド活性化関数が用いられており、入力された特徴ベクトルを0から1の範囲の「異常スコア(δ)」に変換します。スコアが1に近いほど、土石流の発生傾向が高いことを示します。
算出された異常スコアに対し、経験的に設定された閾値(θ = 0.6)が適用されます。スコアが0.6を超えた場合(δ > 0.6)、システムは「異常(Abnormal)」と判断し、初期検知を行います。
2D CNNによる検証プロセス: 「異常」と検知されたセグメントは、次に土石流災害認識ネットワーク(2D CNN)0.5を超えれば最終的に「土石流(Debris flow)」、そうでなければ「誤報(False alarm)」と識別します。この流れにより、ノイズによる高い異常スコアを誤報として排除することが可能になります。

結果
独自データセット「Debrisflow23」を用いた評価の結果、以下の高い性能が示されました。
検知・認識精度: 検知精度は86.3% AUC、認識精度は83.7% AUCを達成し、システム全体の最終的な識別精度は88.1% AUCに達しました。
リアルタイム性能: 処理速度は68 FPSを記録しており、実用的な早期警戒システムとして十分な速度を備えていることが証明されました。

考察
ビデオレベルの動的な検知と、画像レベルの認識を組み合わせることで、単一のモデルよりも精度と堅牢性が向上することが確認されました。特に、第1段階の検知ネットワークで見落とし(偽陰性)を抑えつつ、第2段階の認識ネットワークで誤報(偽陽性)を削減する構造が有効に機能しています。

今後の課題
データ多様性の不足: 本システムの学習に使用されたデータセット(Debrisflow23)は、現時点では規模が比較的小さく、「あらゆる天候条件や環境、流れの挙動を網羅できているわけではない」。
精度の低下: 複雑で変動の激しい現場環境においては、システムの汎用性(汎化能力)が低下する可能性がある。実際に、特定の条件下では検知ネットワークが誤報を出したり、逆に発生を見逃したりする「失敗事例」も確認されています。

動画による検知は簡単で、このようなDNNなどの機械学習までは必要なく、画像処理でも対応可能です。実際、動画にラベリングをする際にリアルタイム処理の動態検知を使うこともあります。
画像処理技術だと昔から普及しているので、社会実装しようと思えば誰でも容易にできたのですが、欠点があります。夜間、霧など。閾値を昼間と変得ないといけなかったり、そもそも視認できなかったり。この欠点があるので実装されてこなかったのだろうと思われます。

近年、国内でもCCTVでなく簡易カメラを設置して対応する研究が見受けられますが、欠点は同じです。ま、簡易カメラなら流されても痛くはないので 多数つけられるという長所はありますが。

解決策は熱赤外カメラ。ただし現状は高価。安いものは距離、解像度が不足しています。もう少し待てば安価なカメラが出てくるでしょう。

文献:Characterizing and clustering debris flow and environmental noise seismic signals using unsupervised deep learning

Characterizing and clustering debris flow and environmental noise seismic signals using unsupervised deep learning | Geophysical Journal International | Oxford Academic

AI要約

1. 背景
土石流は山岳地帯において極めて破壊的な自然災害であり、その対策として微震モニタリングが有効なリアルタイム検知手法となっています。しかし、従来の技術では土石流、落石、地震、環境ノイズといった異なる発生源からの混合信号を識別することが困難であり、土石流イベントの完全な動的進化を理解する上での制約となっていました。また、既存の教師あり学習は大量のラベル付きデータを必要としますが、地震データの多くはラベルがなく、人的なラベル付けには誤りも伴うため、ラベルなしデータから信号の固有構造を自動的に識別できる教師なし学習手法の確立が求められていました。

2. 手法

スペクトログラムの作成:
信号選択: 信号対雑音比(SNR)が高い垂直成分を選択。
窓関数適用: 信号の連続性と完全性を確保するため、60秒の固定窓長を採用。
基本的処理: instrument response(計器特性)の除去、デトレンド、デミーンを実施。
フィルタリング: 5Hz以上の高周波エネルギーを強調するため、4次バターワースハイパスフィルタを適用。
時間・周波数変換: 短時間フーリエ変換(STFT)を実施し、ハニング窓と50%のオーバーラップを設定。
正規化: 最大エネルギーで全特徴量を正規化。

データの分割方法とデータ数:
総データ数: 42,057個のスペクトログラムを使用。
分割方法: ACEの学習において、70%を訓練データ、30%を検証データとして非復元ランダムサンプリングにより分割しました(ホールドアウト検証)。過学習対策として、検証損失が30エポック連続で減少しない場合に停止する「早期停止(Early Stopping)」を採用しています。
ラベル付きデータの割合: 本研究は基本的に教師なし学習ですが、最適なクラスター数(K)の決定などの評価のために、合計データのうち2,000個(約4.7%)のランダムに選択され手動でラベル付けされたサンプルが使用されました。

機械学習手法:
モデルの流れ: 生の地震動信号 → 前処理 → 2Dスペクトログラム生成 → ACEエンコーダによる16次元潜在特徴量への圧縮 → GMM/DECによるクラスタリング(K=24)→ クラスター内頻出ラベルによるクラス分類。

特徴量抽出(深層オートエンコーダ: ACE): 2次元スペクトログラムを入力とし、4層の畳み込み層を持つエンコーダを用いて、高次元データ(38,400次元)を16次元の「潜在空間(Latent Space)」に圧縮し、コンパクトな特徴表現を獲得します。

クラスタリングとクラス分類の詳細: 抽出された潜在特徴量に対し、Deep Embedded Clustering (DEC) 、 ガウス混合モデル (GMM) を適用して自動分類を行います。最適なクラスター数は、外部評価指標(ARI、NMI、Purity)に基づき、複雑な信号構造を捉えるのに最適な K=24 と決定されました。最終的なクラス分類(ラベル付け)は、名前のない各クラスター内を確認し、「そのクラスター内で最も頻繁に出現する既知のラベル」をそのクラスターの代表ラベルとして定義することで行われます。

目的変数(分類対象): 土石流、落石、地震、環境ノイズの4カテゴリです。

3. 結果
分類精度とF1スコア:GMMの全体精度は92.32%に対し、DECは複雑な土石流信号の識別に優れ、全体精度93.21%を達成しました。各手法のカテゴリ別F1スコアは以下の通りです。

土石流: GMM 0.891 / DEC 0.9392
環境ノイズ: GMM 0.9134 / DEC 0.9233
地震: GMM 0.9758 / DEC 0.9759
落石: GMM 0.9184 / DEC 0.8661

精度向上:
同じガウス混合モデル(GMM)を用いて以下の2パターンで実験を行いました。

全データ一括処理: 42,057個のデータを一度にクラスタリングした場合、精度は92.32%でした。
サブセット分割処理: データを5つのサブセットに分割してそれぞれクラスタリングを行った結果、平均精度は96.81%にまで向上しました。

複雑なパターンの認識: データセットが巨大すぎると、AIはその中に隠れている非常に複雑なパターンを見落としてしまうことがあります。データを小さく分割することで、AIは各サブセット特有の細かい特徴に集中できるようになります。
データ間の密接な関係性の把握: 分割された後のデータ群では、個々のデータポイント同士の結びつきがより強まり、AIがデータの「潜在的な構造( underlying structure)」をより効果的に特定できるようになります。
計算の効率化と負荷軽減: 大規模なデータを一度に計算するよりも、分割して処理するほうが計算上の複雑さが抑えられ、結果としてより洗練されたクラスタリング結果を得ることが可能になります。

潜在特徴量の物理的な意味: 抽出された16個の潜在特徴量は、従来の地震学的属性との相関分析により、以下の物理的意味を持つことが確認されました。
時間領域の反復性: 自己相関関数のピーク数(信号の周期性や規則性)と最も強い相関があります。
周波数領域の特性: 中心周波数の第1四分位数、正規化DFTの分散および中央値(エネルギーの分布特性)と強い正の相関を示します。
これらは、土石流の各段階で変化する物理特性を効果的に捉えています。

4. 考察
土石流の「発生・輸送・堆積」の違い: クラスタリングにより、単一の土石流イベントを物理的な段階に対応する3〜4つのクラスターに自動分割することに成功しました。
発生(初期・メインサージ): 振幅が劇的に増大し、パワースペクトル密度(PSD)が最大になりますが、大量の物質の摺動により中心周波数は比較的低くなります。また、強い攪乱により楕円率と入射角が大きくなります。
輸送(通過): サージ(段波)の影響により、10〜50Hzの範囲で周波数とエネルギーが進化します。
堆積(終息): 流速と粒子サイズの減少により、エネルギーは低く、中心周波数は高くなる傾向があります。波の運動はより規則的で垂直志向になります。

教師なし学習の有効性: 大規模なラベルなしリアルタイムデータの処理に適しており、高密度観測ネットワークでのパターン発見において教師あり学習よりも汎用性が高いことが示されました。

早期警戒への応用: 潜在特徴量を教師あり学習(ランダムフォレスト)の入力に用いることで、93.15%の精度でリアルタイム早期警戒が可能になる展望が示されました。


1分データでも、ラベリングの手間はかなり大きくなります。それを回避すべく教師なし手法を利用する、という方針です。ただし、評価が必要なのでいくらかはラベリングされています。ある程度のドメインシフトにも対応できそうな手法に思えます。

24クラスタ → 4クラスなので、土石流の「発生・輸送・堆積」などへ自動的に対応できるところも当手法の特徴です。これは教師あり学習でラベルの境界を決定するのが難しいところですので、人為的ミスを回避する点でも魅力的です。

サブクラスタに分けておき、それぞれの結果を Voting するようにしてもリアルタイム運用は可能でしょう。


2026年3月8日日曜日

文献:Adaptive Machine Learning Framework for Debris Flow Monitoring

Adaptive Machine Learning Framework for Debris Flow Monitoring in Nonstationary Environments in Illgraben, Switzerland by Jui-Ming Chang, Qi Zhou, Hui Tang, Jens M. Turowski, Ko Ko :: SSRN

AI要約

1. 背景
土石流は山岳地帯における主要な災害であり、地震動データを用いた機械学習モデルによる検知が有効です。しかし、地球物理データの性質が時間とともに変化する「コンセプトドリフト」という現象が、モデルの長期的かつ汎用的な運用において大きな課題となります。
本研究は、このデータ分布の変化(非定常性)に直接対応し、高い検知精度を維持できる適応型機械学習フレームワークを開発することを目的としています。

2. 手法
機械学習手法
複数のモデルを組み合わせた Stacked Heterogeneous Ensemble を採用しています。

ベース学習器
LSTM+MLP: 10分間のシーケンスを処理するLSTMと、最新の値を処理するMLPを統合したハイブリッド構造で、時間依存性と瞬時の特徴を捉えます。
XGBoost (XGB): 静的な勾配ブースティングモデル。
ランダムフォレスト (RF): 静的な決定木アンサンブルモデル。

メタ学習器
ロジスティック回帰: 各ベースモデルの出力を統合し、単一の堅牢な確率スコアを算出します。

ハイパーパラメータ最適化
Optunaフレームワークを使用し、40回の試行を経て各ベースモデルを最適化しました。

変数
目的変数: 1分間の観測ウィンドウにおける「土石流(debris flow)」または「土石流なし(no debris flow)」のバイナリラベル。
説明変数: 当初は5つのドメイン(ベンフォードの法則、波形、スペクトル、スペクトログラム、ネットワーク特性)からなる80個の特徴量を使用していました。これに時間力学やエネルギー分布を捉える22個の新しい変数を加え、合計92個の特徴量を候補としています。

インバランスデータ
土石流イベントは極めて稀であり、データセットには深刻なクラス不均衡(クラスインバランス)が存在します。
不均衡比: 2017-2018年で0.0023、2019年で0.0078、2020年で0.0094と非常に低くなっています。

データ分割(図1bフローチャートに基づく)
各年6月から8月までの厳密な時系列データを使用しています。
学習(Training): 2017年から2018年のデータを使用。モデルの初期構築に用いられます。
検証(Validation): 2019年のデータを使用。これをさらに80/20に分割し、80%をメタ学習器の訓練に、残り20%を微調整(Tuning)用に保持します。
テスト(Testing): 2020年のデータ(Hold-out test year)を使用。最終的な汎用性を評価します。
データ数: 2020年のテストデータでは、ステーションごとに約13万サンプル(1分単位)が含まれています(例: ILL18でTN=131,371)。

適応機構とドリフト検知
ドリフト検知: 2019年の検証期間と2020年のテスト期間の間の分布変化を、2標本コルモゴロフ–スミルノフ検定(KS検定)を用いて判定します。
有意水準: p < 0.05 で有意なドリフトを検知します。
対応動作: 有意なドリフトが検知された場合、事前に保持していた2019年のデータ(20%分)を用いて、事前に訓練されたLSTM+MLPモデルを**微調整(fine-tuning)**し、新しいデータ分布に適応させます。

3. 結果
全体性能: 3つのモニタリングステーションにおいて、F1スコア0.873から0.927という高い精度を達成しました。

ステーション別の特性: 最上流のILL18で最高のF1スコア(0.927)を記録した一方、下流のステーションでは環境ノイズの影響により、7月に精度が低下する傾向が見られました。

特徴量の寄与: 全92個の特徴量から、ドリフトに強い上位25個を選択して学習に用いる「ドリフト対応特徴量選択」が、モデルの汎用性向上に最も寄与することが明らかになりました。

4. 考察
適応戦略の重要性: 単一のグローバルモデルでは時間的・場所的な変化に対応できず、ステーション固有かつ適応型のシステムが必要不可欠です。
時間的モデルの役割: LSTM+MLPのような時間的依存性を学習するモデルは、見逃し(False Negative)を減らす上で不可欠な要素であることが確認されました。

今後の課題: モデルの長期的な安定性を確保するためには、最新データを用いた定期的またはスライディングウィンドウ方式による再学習プロトコルの確立が重要です。

特徴量のリンクは張られていませんが、以下がベースになっています。
agupubs.onlinelibrary.wiley.com/action/downloadSupplement?doi=10.1029%2F2024JF008094&file=2024JF008094-sup-0001-Supporting+Information+SI-S01.pdf

ドリフト(ドメインシフト)への対処療法が書かれた文献です。

  • シグナルの「時間的進化」を捉えることが精度維持の鍵。
  • 統計的な変化(ドリフト)を検知した場合のみ、直近のデータを用いて時系列モデルを再訓練する。
  • ドリフトを考慮した特徴量選択が必要。

同じ渓流でも上流と下流、経過時間によって振動は変化し、最適な特徴量は異なる。変化を考慮したモデルが必要、という考えに沿ってモデルが作成されています。ドリフトの有無の判断にKS検定を用いており、その結果を特徴量重要度にも反映しています。
既存の手法を組み合わせて対応するといった、実務向きな内容だと思います。

2026年2月28日土曜日

文献:Spatial variations in groundwater chemistry in Uganda

Spatial variations in groundwater chemistry in Uganda: Geogenic origins and geochemical controls across diverse hydrogeological settings - ScienceDirect

AI要約

ウガンダの人口の約75%は地下水に依存しており、特に農村部や都市周辺部においてその重要性は極めて高い。本調査では、5つの主要な水理地質学的環境(先カンブリア紀変成堆積岩、片麻岩複合体、未固結堆積物、火山岩、変成火山岩)を対象に分析が行われた。

  • 主要な水質特性: 地下水の多くは、地質との平衡状態を反映した新鮮な「Ca-HCO3(炭酸水素カルシウム)型」であるが、変成火山岩(MV)や堆積物(SDM)の設定では、陽イオン交換や地球化学的進化の進行を反映した「Na-HCO3(炭酸水素ナトリウム)型」や「Na-Cl(塩化ナトリウム)型」が支配的である。
  • 水質基準の超過状況: 世界保健機関(WHO)の飲料水指針値を超える項目として、硝酸態窒素(NO3⁻)が全サンプルの14%で検出された。その他、マンガン(Mn)5%、鉄(Fe)3%、フッ化物(F⁻)3%、塩化物(Cl⁻)3%の割合で超過が見られた。
  • 地球化学的制御要因: ケイ酸塩(主にフェルシック岩)の風化、陽イオン交換、および炭酸塩の溶解が主要な支配要因である。一方で、蒸発濃縮や石膏の溶解による影響は最小限であることが示された。
  • 二次鉱物の安定性: 火山岩地域では、急速な流動と排水条件により「カオリナイト」が安定する一方、その他の地域では「クリノプチロライト」が安定する傾向にある。

1. 水理地質学的環境の概要

調査対象となったウガンダの地質は多岐にわたり、30億年以上の歴史を持つ先カンブリア紀の結晶質の基盤岩が大部分を占める。本報告書では、以下の5つの区分に基づき分析を行っている。

略称
水理地質学的区分
サンプル数 (n)
主な特徴
MS
先カンブリア紀変成堆積岩
30
ビクトリア湖テレーンの花崗岩・緑色岩など。
GG
顆粒岩・片麻岩複合体
21
ウガンダ東部(イガンガ、カリロ、トロロ)に広く分布。
SDM
未固結堆積物
10
キョーガ湖盆地周辺。高い浸透性を持つ。
VO
火山岩
7
エルゴン山周辺。アルカリ性/ソーダ性火山岩。
MV
変成火山岩
6
ブシア周辺の変成した火山岩。


2. 地下水の化学特性と空間的変動
地下水の化学組成は、水理地質学的環境によって顕著な差異を示す。

2.1 主要イオン
地下水の多くは、化学的進化が限定的な浅層地下水に典型的なCa-HCO3型に分類される。しかし、特定の地質条件下では異なる特性が見られる。

  • SDM(堆積物): 陽イオン(Ca, K, Mg, Na)および陰イオン(Cl⁻, SO₄²⁻, F⁻, HCO₃⁻)の濃度が最も高い。これは、未固結堆積物の高い空隙率と透過性が鉱物溶解を促進しているためと考えられる。
  • VO(火山岩): 主要イオンの濃度が最も低い。サンプリングされた湧水は流速が速く、岩石との接触時間が短いため、岩石・水相互作用が限定的であることを示唆している。
  • MV(変成火山岩): Na-HCO3型が支配的であり、帯水層の脱塩過程における陽イオン交換の影響が強い。
  • SDMの一部: Na-Cl型が優勢であり、蒸発濃縮、粘土質堆積物内の陽イオン交換、または人類起源の入力の影響が示唆される。

2.2 溶存ケイ素 (Si)
Si濃度は、SDM > MV > GG > MS > VO の順で低下する。これはケイ酸塩の風化率の差、または各環境におけるフェルシック岩の分布と風化の程度を反映している。

3. 地球化学的プロセスと支配要因
分析結果から、地下水質を形成する主なメカニズムが特定された。

3.1 鉱物の風化と溶解

  • ケイ酸塩風化: 全ての環境において、(Na⁺+K⁺)/Cl⁻比が1を超えており、ケイ酸塩(長石類)の風化が主要なイオン源であることを示している。
  • 炭酸塩溶解: カルサイトやドロマイトの溶解が、特に火山岩地域などでCaやMgの供給源となっている。
  • 限定的な影響: ギブス図(Gibbs diagram)によれば、岩石の風化が支配的であり、蒸発や降水による影響は小さい。また、石膏の溶解による影響も極めて限定的である。

3.2 陽イオン交換プロセス
(Na⁺+K⁺)-Cl⁻ と (Ca²⁺+Mg²⁺)-(HCO₃⁻+SO₄²⁻) の関係から、陽イオン交換が地下水組成の変化に重要な役割を果たしていることが判明した。特にMVやSDMでは、Ca²⁺やMg²⁺が鉱物表面のNa⁺と交換されるプロセスが顕著である。

3.3 二次鉱物の熱力学的平衡

  • Geochemist's Workbench® (GWB) 2023 Community Edition: Piper図やDurov図の作成、飽和指数(SI)安定図の作成に使用されました。この計算には、thermo.tdat データベースが利用された。
  • PHREEQC : Ca、K、Si、Na、pH、温度などの入力パラメータを用いて、全サンプルのイオン活動度を計算するために使用されました。こちらには、Phreeqc.dat データベースが利用された。

地球化学モデリングにより、以下の平衡状態が確認された。

  • 不飽和状態: ほとんどのサンプルでカルサイト、ドロマイト、石膏、ハロゲン化物は不飽和であり、これらが溶解する余地があることを示している。
  • 過飽和状態: 石英(Quartz)については一貫して過飽和状態にある。
  • 安定相の相違: 火山岩(VO)地域では「カオリナイト」が安定な二次鉱物として形成される(モノシアリタイゼーション)。これは急速な地下水流動と低いケイ素蓄積を反映している。一方、他の環境では「クリノプチロライト(沸石の一種)」が安定相となりやすい。
  • 溶解度の差: 石英は非常に安定した結晶構造を持っており、溶解度が非常に低い。一方、非晶質シリカは構造が不規則で、石英よりもはるかに水に溶けやすい(溶解度が高い)。
  • シリカ濃度の供給源: この地域の地下水中のシリカは、主に長石(アルバイト、カリ長石、灰長石)などのケイ酸塩鉱物の風化(加水分解)によって供給されています。
  • 飽和状態の閾値: 地下水に溶け出したシリカ(H4SiO4 )の濃度は、石英の低い溶解度を上回るには十分な量であるため、石英に対しては「過飽和(SI > 0)」となります。しかし、その濃度は非晶質シリカの高い溶解度に達するほどではないため、非晶質シリカに対しては「不飽和(SI < 0)」の状態にとどまっています。
  • 沈殿の速度(キネティクス): 石英は熱力学的に過飽和であっても、実際に沈殿して結晶化する速度が非常に遅いという特徴があります。そのため、地下水中のシリカ濃度は、石英の飽和線を超えて、非晶質シリカの飽和線に近いレベル(または二次鉱物を形成するレベル)まで上昇して維持されます。
  • このように、地下水の化学組成は、最も溶けにくい相(石英)と最も溶けやすい相(非晶質シリカ)の中間に位置しており、これが二次鉱物(クリノプチロライトやカオリナイトなど)の形成に影響を与えています。
3.4 考察 
  • ウガンダの火山岩地域(VO)では、湧水などの迅速な地下水の流れがあり、非常に良好排水(well-drained)されています。このため、長石などの一次鉱物が風化してシリカが放出されても、それが蓄積せずに洗い流されるため、溶解シリカ濃度が他の地域ほど高くならず、カオリナイトが熱力学的に安定な相となります。
  • このような迅速な水の循環と低いシリカ蓄積条件下では、ケイ酸塩鉱物の風化プロセスとしてmonosiallitisation が活発になります。これは、シリカが豊富な二次鉱物(クリノプチロライトなどのゼオライト)が形成される代わりに、よりシリカの含有率が低いカオリナイトが形成されるプロセスです。
  • 石英は非常に溶解度が低いため、カオリナイトが安定するような比較的低いシリカ濃度であっても、石英の飽和指数(SI)は0を超え、過飽和状態になります。つまり、「石英にとっては十分な濃度だが、ゼオライト(クリノプチロライト)などのよりシリカを必要とする鉱物が形成されるには不十分な濃度」という絶妙なバランスにあるときに、カオリナイトが安定します。 
  • ウガンダの火山岩地域(VO)の地下水は、調査された設定の中で最も高いpH値(最大8.4)を示しており、この化学的条件がカオリナイトの安定領域に位置する要因の1つとなっています
  • 対照的に、MS(変成堆積岩)やGG(片麻岩)などの他の地質環境では、水の滞留時間が長くシリカが蓄積しやすいため、よりシリカ濃度の高い環境で安定するクリノプチロライトが優勢になります。
  • クリノプチロライトは、たとえ地層中での含有量が少なくても、活発なイオン交換を促進することで地下水の化学的性質に直接的な影響を及ぼすことができます。
  • 陽イオンの組成変化: 特にメタ火山岩(MV)地域などで顕著ですが、地下水中のカルシウム(Ca2+)やマグネシウム(Mg2+)が、鉱物表面のナトリウム(Na+)と優先的に交換されるプロセス(陽イオン交換)を支えています。
  • このイオン交換の結果、地下水のタイプが一般的なCa-HCO3型から、より化学的に進化したNa-HCO3型やNa-Cl型へとシフトします。
  • フッ化物濃度の制御: ナトリウムに富む水(Na-rich waters)へと変化することで、ベース交換プロセスを通じてカルシウム濃度が低下し、その結果として蛍石(Fluorite)などからのフッ化物の放出・溶解を助長する傾向があります。 
  • SDM(未固結堆積岩)地域においてNa-Cl型(塩化ナトリウム型)の地下水が支配的(サンプルの40%)になる背景には、地質学的・水文学的な複数の要因が組み合わさっています。
  • 蒸発濃縮プロセスの影響: SDM地域の地下水は比較的浅く、水理的に活動的な層に存在します。このような環境では、地下水面に近い場所での蒸発濃縮が、地下水の塩分濃度(Na⁺およびCl⁻)を高める強力な制御要因として働いています。
  • 局所的な残留塩分: この地域の地質は細粒の湖成堆積物を含んでおり、そこに閉じ込められた局所的な残留塩分(residual salinity)が地下水に影響を与えている可能性が指摘されています。
  • 粘土質堆積物での陽イオン交換: SDM地域に含まれる粘土が豊富な堆積物において、陽イオン交換が進むことでナトリウムが濃縮されやすい環境にあります。
  • 高い空隙率と浸透性: ウガンダの未固結堆積物は高い空隙率と浸透性を持っており、これが迅速な水の移動を可能にしています。通常、流れが速いと反応時間は短くなりますが、常に未飽和の新しい水が鉱物表面に供給され続けることで、化学的勾配が維持され、活発な鉱物溶解が継続します。
  • 人為的要因: 農業や都市化に伴う人為的な入力(下水など)も、Na⁺とCl⁻の両方を供給する要因として寄与していると考えられています。

 4. 水質評価と利用可能性

4.1 飲料水としての適合性
全体として多くの地点でWHOの指針値を満たしているが、一部で超過が確認された。

項目
全体超過率
環境別の主な超過状況
起源の推定
硝酸態窒素 (NO3⁻)
14%
MS (20%), GG (14%)
農地排水、都市汚染、不適切な衛生施設(人為的)
マンガン (Mn)
5%
MS (13%)
母岩の自然風化(地質的)
鉄 (Fe)
3%
MV (17%), GG (5%)
母岩の風化、パイプの腐食(地質的/設備的)
フッ化物 (F⁻)
3%
SDM (10%)
フッ石や雲母などの鉱物溶解(地質的)

4.2 灌漑への適合性
ほとんどのサンプルは「低〜中程度の塩分濃度」および「低ナトリウムリスク(C1-S1 〜 C3-S1)」に分類され、多くの作物に適している。ただし、一部のボーリング孔(SDM, MS, GG)ではマグネシウム・ハザード比が1を超えており、長期的な使用により土壌の浸透性を低下させるリスクがある。

5. 結論
本研究は、ウガンダの多様な地質が地下水のベースライン水質を決定する主要な要因であることを明らかにした。

  • 地質学的支配: 地下水の化学組成は、主にフェルシックなケイ酸塩鉱物の風化、炭酸塩の溶解、および陽イオン交換によって形成されている。
  • 空間的変動: 堆積物地域(SDM)では溶存イオン濃度が高く、火山岩地域(VO)では低い。
  • 人為的影響: 硝酸態窒素の超過は人為的な汚染(農業や都市廃棄物)を示唆しており、特に人口密度の高い地域での監視が必要である。
  • 管理への示唆: 水理地質学的環境ごとに異なる水質特性とリスクが存在するため、地域特性に応じた地下水管理とモニタリング戦略の構築が求められる。


カオリンや沸石の熱力学的安定領域、イオン交換に伴う水質の変化などが記されています。試験結果を使って、分析を行い、評価するといった道理にかなった手順が踏まれていて、理解しやすい内容だと思います。

文献:Sources and mobilisation pathways for geogenic arsenic contamination in groundwaters

Sources and mobilisation pathways for geogenic arsenic contamination in groundwaters; a case study from eastern Ireland - ScienceDirect

AI要約

本資料は、アイルランド東部ダブリン州ブリッタス(Brittas)周辺の地下水における地質学的ヒ素(As)汚染の調査結果をまとめたものである。主な知見は以下の通りである。

  • 深刻な汚染状況: 調査対象となった私用井戸の50%以上(追跡調査では70%以上)で、世界保健機関(WHO)の飲料水基準(10 μg/L)を超えるヒ素が検出された。最大濃度は69 μg/Lに達している。
  • 地質学的供給源: 主な供給源は、下部古生代の灰色輝緑岩(グレーワッケ)および粘板岩の割れ目内にある石英脈に含まれる「硫砒鉄鉱(Arsenopyrite)」の酸化である。
  • 動態経路の複雑性: ヒ素は主に酸化プロセスによって溶出するが、二酸化マンガンや酸化鉄への吸着・脱離、さらには断層に関連した深部地下水の流入など、複数の段階を経て移動している。
  • ポンプによる曝露リスクの増大: 家庭用揚水ポンプの高流速運転により、酸化鉄等に吸着した粒子状のヒ素が巻き上げられ、蛇口水では低流量サンプリング時を大幅に上回る濃度(最大116.8 μg/L)が検出された。これは住民の健康リスクが過小評価されている可能性を示唆している。

--------------------------------------------------------------------------------

1. 背景と調査の目的

アイルランドには17万本以上の私用井戸が存在するが、地質学的要因によるヒ素汚染の研究はこれまで限定的であった。ヒ素は国際がん研究機関(IARC)によりグループ1の純粋な発がん性物質に分類されており、皮膚疾患やがんを含む広範な健康被害を引き起こす。
本調査は、アイルランド地質調査所(GSI)の「Tellusプロジェクト」による河川堆積物調査で高濃度のヒ素異常が確認されたダブリン州ブリッタス北西部の地域を対象に、地下水の水質とヒ素の移動メカニズムを解明するために実施された。

--------------------------------------------------------------------------------

2. 地質学的および水理学的背景

2.1 地質構造
主な岩石: 下部古生代キルカレン層群(Kilcullen Group)の灰色輝緑岩、粘板岩、千枚岩。
特筆すべき構造: 岩石の変形が激しいゾーンには、最大50cm厚の石英脈が発達している。また、東西方向に走る顕著な断層が地下水の流動経路に影響を与えている。

2.2 鉱物学的供給源
SEM-EDX(走査電子顕微鏡エネルギー分散型X線分析)により、以下の点が確認された。

  • 硫砒鉄鉱(FeAsS): 石英脈と岩石の界面に直径約1mmの風化した結晶として存在。これがヒ素の主要な一次供給源である。
  • 黄鉄鉱(Pyrite): 地域全体に広く分布しているが、顕著なヒ素の含有は見られなかった。
  • 重晶石(Baryte): 黄鉄鉱とともに確認されており、後述する硫酸塩濃度の抑制に関与している。

--------------------------------------------------------------------------------

3. ヒ素濃度の分析結果

3.1 地下水および地表水
予備調査(29地点): 55%のサンプルでWHO基準(10 μg/L)を超過。中央値は12.9 μg/L。
追跡調査(13地点): 低流量サンプリングの結果、70%以上がWHO基準を超過。ろ過水の中央値は24 μg/L、最大51.7 μg/L。
地表水: 小さな河川でも最大85 μg/L、中央値54.3 μg/Lと、極めて高いヒ素濃度が検出された。

3.2 蛇口水(家庭での飲用状態)
低流量で採取した地下水サンプルと比較して、家庭の蛇口から直接採取した未ろ過水(Tap Water)では、ヒ素濃度が著しく上昇するケースが確認された。
ASW03地点: 低流量サンプリングでは9 μg/L未満であったが、蛇口水では最大116.8 μg/Lを記録した。

--------------------------------------------------------------------------------

4. ヒ素の動態経路と化学的挙動
調査データに基づき、ヒ素が岩石から飲料水へ移動するプロセスには、以下の多段階のステップが関与していると推測される。

4.1 一次溶出:酸化プロセス
硫砒鉄鉱が地下水中の酸素と反応して酸化・溶解し、ヒ素と硫酸塩を放出する。
指標: 低pH、低アルカリ度、低電気伝導度、高い酸化還元電位(Eh)を持つ地下水ほど、ヒ素濃度が高い傾向にある。

4.2 二次沈殿と吸着
硫酸塩の挙動: 硫砒鉄鉱の酸化によって硫酸塩も放出されるはずだが、実際にはヒ素濃度と硫酸塩濃度には負の相関が見られる。これは、重晶石(BaSO4)の沈殿によって硫酸塩が消費・抑制されているためである。
吸着メカニズム: 溶出したヒ素(主に五価のヒ素:H2AsO4⁻ または HAsO4²⁻)は、岩石の割れ目表面にある鉄・マンガン酸化物/水酸化物の微粒子に吸着される。

4.3 物理的同伴(揚水による影響)
家庭で使用される強力な潜水ポンプは、井戸内の酸化鉄粒子(ヒ素を吸着したもの)を巻き上げる。これにより、本来は不溶性の粒子として存在していたヒ素が飲料水中に混入し、消費者の曝露量を急増させる。

4.4 深部地下水の関与
断層付近の深い井戸(50m以上)では、通常とは異なる水質が見られた。
特徴: 高アルカリ度、高pH、高マグネシウム(Mg)、高マンガン(Mn)濃度。
推論: 断層を介して、より還元的で異なる反応経路を経た深い層の地下水が混入しており、これが高いヒ素濃度の一因となっている。

--------------------------------------------------------------------------------

5. 結論と提言

ブリッタス地域における調査は、アイルランドの fractured bedrock(割れ目のある基盤岩)帯帯水層において、自然由来のヒ素が深刻なリスクとなっていることを実証した。

  • 曝露リスクの過小評価: 標準的な低流量サンプリングでは、粒子同伴によるヒ素の総量を捉えきれず、実際の飲用リスクを過小評価する可能性がある。
  • 広域的な警戒の必要性: Tellusプロジェクトのような堆積物調査データは、同様の地質学的リスクがある地域を特定するための重要なツールとなる。
  • 公衆衛生上の課題: アイルランドの井戸所有者は病原菌への意識は高いが、ヒ素のような地質学的汚染物質のリスクを軽視する傾向にある。汚染が疑われる地域では、適切な水質検査と対策が不可欠である。
鉱物学、地質学からの科学的視点と、実用的な提言がセットで記載されている文献です。まとまっています。
ポンプを使った方が物理的な巻き上げを伴い高濃度となる場合があることは初めて知りました。低流量が原則と思っていましたが、頭が固かったようです。

2026年2月23日月曜日

文献:Landslide susceptibility zoning through physically-based limit equilibrium method modelling

Landslide susceptibility zoning through physically-based limit equilibrium method modelling - ScienceDirect

AI要約

背景
 地滑りは世界で最も普及している地形学的災害の一つであり、気候変動による豪雨の増加に伴い、その頻度が高まっています。被害軽減や都市計画のためには、特定の地域での発生可能性を示す地滑り感受性(LS)の評価とマッピングが不可欠です。従来の評価手法には、主観的な定性的手法と、統計的または物理学的な定量的手法があります。統計的手法は広域評価に適していますが物理的プロセスを直接考慮せず、物理モデルは詳細な地盤データが必要なため広域適用が困難という課題がありました。本研究は、これらを克服する新しい広域物理モデル手法を提案しています。

手法
本研究では、GeoPhyLS(Geospatial Physically-based Landslide Susceptibility)と呼ばれる手法を開発しました。この手法は以下の4つのコードブロックで構成されます。

1. Extractor(抽出器): DEMから排水路に基づいた Half-Basins (HB) を作成し、各HB内で斜面方位(モーダル値および±45度)に沿った2次元断面を自動生成します。これに地質図に基づく力学パラメータを割り当てます。

• ハーフ・ベイスン(HB)の活用: 地形を、尾根線(分水嶺)から排水路(流路)までの単位である「ハーフ・ベイスン」に分割します。これは地形的に意味のある単位でモデルの境界を定義するためです。計算効率を最適化するため、ユーザーはDEMの解像度を調整したり、HBのサイズを選択したりできます。

• 断面方向の決定: 各HBにおいて、地形の方位(アスペクト)の最頻値(モード値)と、そこから±45度変化させた計3つの方向に沿って断面線を引きます。これは、単一の方向だけでは「最も急な斜面」や「最も重大な崩壊方向」を見逃すリスクがあるため、包括的に斜面を調査するための工夫です。

• パラメータの統合: 断面上の各点には、地質図から抽出された**有効粘着力(c')、有効内部摩擦角(φ')、単位体積重量(γ)**などの力学パラメータが割り当てられます。最終的に、解析ソフトウェアCSSAPで読み込み可能な形式(.dat, .geo, .fld, .utm, .modファイル)として出力されます。

2. Analyser(分析器): SSAP2010ソフトウェアを用い、2次元極限平衡法(LEM)ランダムサーチアルゴリズムの使用で、滑り面の形状(円弧、平面、複合線)を事前に仮定せずに探索し、局所的な安全率(SF)を算出します。 

• SSAP2010の使用: 2次元LEM解析ソフトSSAP2010のコマンドライン版(CSSAP)を使用し、並列処理によって数百から数千の計算タスクを高速に処理します。

• ランダムサーチアルゴリズムの革新性: 本手法の最大の特徴は、滑り面の形状を事前に仮定しない点にあります。従来のモデルが円弧や平面を仮定するのに対し、このアルゴリズムは円弧、平面、さらには「複合線(mixed-line)」を含む任意の形状の滑り面を自動的に探索します。これにより、浅い崩壊から深い崩壊まで、多様なメカニズムをバイアスなしに評価できます。

3. Interpolator(補間器): 各断面の最小局所SF値をグリッドノードに抽出し、IDW法で領域全体に空間補間してSFマップと滑り面深さマップを生成します。

4. Classifier(分類器): SFを単なる絶対値ではなく「不安定指数」と見なし、観測された地滑りデータを用いたロジスティック回帰分析によって、SFを発生確率としてのLSへ変換・分類します。

結果
イタリア南部のボヴィーノを対象とした適用では、地盤物性と水文条件を組み合わせた複数のシナリオ(最悪・妥当・最良)を分析しました。

• 水文条件(Hydraulic settings):
 Saturated(飽和): 地下水位が地表面にあると仮定した「最悪」の条件。
Dry(乾燥): 地下水を考慮しない「最良」の条件。

• 地盤物性条件(Geomechanical parametrisation):
イタリア全土のデジタル地質図(Bucci et al. 2021, 2022)に基づき、対象地域を以下の4つのリソタイプ(岩相)に分類しました。
• 沖積堆積物 (Al)
• フリッシュ / 珪質砕屑性堆積岩 (Ssr)
• 固結砕屑岩 (Ccr)
• 未固結砕屑岩 (Ucr)

広域にわたる詳細な地盤データの不足を補うため、以下のソースからパラメータを取得しました。
• フリッシュ (Ssr): ボヴィーノ南部の斜面で行われた14本のボーリング調査、および深さ3〜20mから採取された不攪乱試料に対する23の室内試験(三軸圧縮試験、直接せん断試験)の結果に基づく学術文献から抽出されました。
• その他の地質単位: 既存の地盤工学データベース(GeoSTRU 2015; Monte et al. 2024a, b)からデータを収集しました。

詳細な層序情報が全域で得られないため、以下の3層構造をモデルとして仮定しました。
• 第1層(地表〜3m): 浅い層を代表させるため、下層よりも低い強度パラメータを割り当てました。
• 第2層(3m〜25m): 文献やデータベースから得られた値を直接割り当てました。
• 第3層(25m以深): 一律に基盤岩(Bedrock)と見なし、非常に高い強度値を設定しました。

地盤物性の自然なばらつきや不確実性に対応するため、単一の平均値ではなく、「最小値(Min)」「平均値(Avg)」「最大値(Max)」の範囲を定義し、以下の3つのシナリオを設定しました。
• 最悪(Worst): 強度パラメータ(c ′ ,ϕ′ )に最小値を適用。
• 妥当(Plausible): 平均値を適用。
• 最良(Best): 最大値を適用。

乾燥状態かつ強度が低い「最悪シナリオ」AUC(受信者動作特性曲線下面積)が0.82と最も高い識別能力を示しました。 

考察
本手法は、従来の無限長斜面モデルでは困難だった多様な滑りメカニズムの評価を広域で可能にしました。SFを確率的なLSに変換することで、シナリオ間の不確実性を考慮しつつ、一貫した感受性パターンを特定できています。既存の統計的手法(LAND-SE)との比較でも同等以上の性能が確認されており、地盤データが限られる広域評価において物理モデルを活用する強力なツールとなります。今後は過去の地滑り履歴が及ぼす影響の統合などが課題です。


土質に応じたパラメータを3ケース設定し、ロジスティック回帰で安全率をLSに変換。 安定エリア: 「0」、 不安定エリア(地滑り地点):「1」としてAUCを計算、といった流れです。物理モデルベースなので、説明性が高いのが特徴です。これにSFやパラメータの取り得る確率が入れば完璧でしょうか。

文献:Physical and Data-Driven Landslide Susceptibility Assessment Frameworks

Physically Based and Data-Driven Models for Landslide Susceptibility Assessment: Principles, Applications, and Challenges

AI要約

背景
地滑りは、インフラ破壊や甚大な人的・経済的損失、二次災害を引き起こす深刻な地質学的現象です。地滑り感受性評価(LSA)は、特定の地域での地滑り発生確率を予測することを目的としており、土地利用計画や防災管理、資源配分において重要な役割を果たします。近年のリモートセンシングやGIS技術の発展に伴い、物理的原理に基づくモデルと統計・機械学習を用いたデータ駆動型モデルの双方が進化していますが、それぞれの利点や限界、相互補完の可能性を整理することが、将来の防災戦略において不可欠となっています。

手法
本論文では、2005年から2024年までの国際的な査読済み論文1,078件を抽出・分析し、以下の2つの主要なアプローチを詳述しています。

1. 物理学的モデル(Physically Based Models) 力学、水理学、材料科学の基本原理に基づき、重力、土壌の粘着力、摩擦、間隙水圧の変化を数式で表現します。

原理: モール・クーロンの破壊基準(せん断強度の算出)やダルシーの法則(地下水浸透の制御)等の数式を用いて、安全率(FS)を算出します。

分類: 静的安定性モデル(無限斜面モデル等)、時間依存の変位を扱う動的変位予測モデル、降雨浸透を考慮する水・土砂結合モデル、気候変動の影響を評価する気候駆動型モデルに分けられます。

ワークフロー: 地形データ(DEM等)や土壌パラメータ(粘着力、内部摩擦角等)を入力し、TRIGRSやSINMAP等のモデルを用いて解析、最終的に感受性マップを作成・検証します。

2. データ駆動型モデル(Data-Driven Models) 過去の地滑り履歴データから機械学習や統計アルゴリズムを用いてパターンを学習します。

アルゴリズム: ロジスティック回帰(LR)等の伝統的統計手法から、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、人工ニューラルネットワーク(ANN)等の機械学習、さらにCNNやTransformerを用いた深層学習まで多岐にわたります。

ワークフロー: 地形、地質、気象、土地利用等の要因を「特徴量」として抽出、データ正規化や主成分分析(PCA)を経てモデルを構築し、ROC曲線やAUC(曲線下面積)等の指標で予測精度を評価します。

結果
地滑り感受性研究は、2010年頃から徐々に増加し、2016年以降はデータ駆動型モデルを中心に爆発的な成長を遂げています。地理的には中国、インド、ベトナム等のアジア諸国の貢献が顕著です。物理学的モデルではTRIGRSやSINMAPが主要な枠組みとして定着している一方、データ駆動型モデルではSVMが最も頻繁に使用され、近年は深層学習(CNN等)による空間特徴抽出が予測精度を大幅に向上させています。

考察
物理学的モデルは、発生メカニズムの解釈性が高いものの、詳細な地質パラメータの取得が困難であり、計算コストも高いという課題があります。一方でデータ駆動型モデルは、非線形で複雑なデータの処理に優れ高い予測精度を誇りますが、「ブラックボックス」化しやすく物理的解釈に欠ける点が弱点です。 今後の展望として、本論文は以下の5点を提唱しています。

1. ハイブリッドモデル: 物理の解釈性と機械学習の予測力を統合したフレームワークの構築。
2. 多源・多尺度データ融合: InSARやLiDAR等、最新のリモートセンシングデータの統合。
3. パラメータ最適化: ベイズ校正等を用いた不確実性の定量的評価。
4. 地域転移性の向上: 特定の地域で学習したモデルを他地域でも適用可能にする技術の確立。
5. 解釈性の向上: SHAP値などの説明可能AI(XAI)の導入による意思決定の透明化。

機械学習による LSM 作成 は、既に出尽くしたように感じます。機械学習の適用だけなら学生でもできるため、ツールを使った報告以上の成果が求められています。
https://phreeqc.blogspot.com/2024/12/das.html

物理モデルベースのレビューは他にもあり、課題や展望として、気象変動への対応やIOT利用なども挙げられていました。



2026年2月22日日曜日

文献:Trend Classification of InSAR Displacement Time Series Using SAE–CNN

Trend Classification of InSAR Displacement Time Series Using SAE–CNN

AI要約

背景
マルチテンポラルInSAR(MTInSAR)技術は、広範囲の地盤変動を測定する上で貴重なツールですが、数百万のコヒーレントターゲット(CT)から得られる変位時系列を解釈し、危険な信号を特定することは困難です。既存の統計的手法は、複雑な変形を記述するのが難しく、InSAR時系列に不可避な位相ノイズの影響を受けやすいという限界がありました。また、先行の機械学習アプローチでは、教師なし学習の結果が初期パラメータや専門知識に大きく依存し、教師あり学習では特徴量エンジニアリングや手動介入の課題がありました。

手法
本研究では、InSAR時系列の分類を目的として、最適化されたStacked Autoencoder(SAE)とConvolutional Neural Network(CNN)を組み合わせた深層学習手法(SAE-CNN)を提案しています。このハイブリッドモデルは、SAEがInSAR時系列からノイズの影響を低減し、微妙な変形パターンに関連する深層特徴を抽出する能力と、CNNが時系列内の様々なスケールで変位トレンドを捉える能力を組み合わせています。SAEは、softmax分類器を備えたバックプロパゲーションニューラルネットワーク(BPNN)によって最適化されています。

分類対象の変形トレンドは、「安定(stable)」、「線形(linear)」、「加速(accelerating)」、「減速(deceleration)」、および「位相アンラップ誤差(PUE)」の5つのカテゴリに定義されました。これらのカテゴリに属する5000のサンプル(各カテゴリ1000サンプル)が、手動の視覚的解釈と相互確認によってラベリングされ、70%がモデルの教師あり学習に、30%が検証に使用されました。データは、Sklearnライブラリを用いて前処理(データ準備、クリーニング、正規化、学習/テスト分割など)され、異常な変形信号に対するモデルの感度を高めるために、線形、加速、減速のカテゴリには重み付けがされました。モデルの性能評価には、精度(accuracy)、適合率(precision)、再現率(recall)、F1スコア、および混同行列が用いられました。

本手法は、2017年1月から2022年9月までの171枚のSentinel-1画像から抽出された561,839のCTに対し、中国昆明市を対象地域として適用されました。昆明市は、急速な都市化、軟弱な地盤、および顕著な地盤変形のため、研究対象として選ばれています。

結果
提案されたSAE-CNNモデルは、ラベル付けされたサンプルに対して95.1%の精度を達成しました。比較実験では、本モデルが従来のCNN、Random Forest(RF)、Support Vector Machine Classification(SVC)といった他の分類モデルよりも、精度、適合率、再現率、F1スコアのすべての指標で優れていることが示されました。特に、従来のCNNと比較して、精度で6.4%、F1値で6.1%の改善が見られました。混同行列の分析により、本モデルは、加速パターンと減速パターンを混同しがちな他のモデルと比較して、加速パターンの認識において7.7%の精度向上を示し、異なる分類カテゴリを区別する能力が優れていることが実証されました。

SAEの有効性は、t-SNE可視化によっても確認され、SAEがInSAR時系列データの分離可能性を著しく向上させ、ノイズを低減し、複雑な分類シナリオを容易に分類可能なものに変えることが示されました。

昆明市への適用結果では、CTの約79.28%が安定していると分類され、残りのうち線形が10.70%、減速が5.30%、加速が4.72%、PUEが3.60%でした。特に、S2地域では危険な加速変形が住宅地で観測され、S3地域では減速変形が主であることが示されました。本手法は、InSAR時系列単独では見逃されがちな地域(例:P1クラスター)における減速変形を特定するなど、広域InSAR結果の解釈を補完する能力があることが示されました。また、不規則な建物や建設活動がある地域(P4, P5, P6)で複雑な変形パターンを識別しました。

計算時間については、提案手法の訓練およびテストに要した時間は32.18秒であり、CNN(3.36秒)やRF(1.69秒)よりは長いものの、SVC(413.46秒)よりは大幅に高速であり、合理的な計算速度で競争力のある精度を提供することが示されました。

考察
本研究のSAE-CNNモデルは、人間の介入なしに、大規模な地盤変動の特徴を区別し、非線形変形信号を検出できるという利点があります。これにより、変形パターンの理解が深まり、MTInSAR成果品の定性的な解釈が向上します。

ただし、本研究で設定された5つのカテゴリは、実際の変形現象を簡略化したものであり、すべての複雑な変形を網羅しているわけではないため、誤分類(誤警報)につながる可能性が指摘されています。この問題は、より高品質な参照サンプルを用いたモデル学習や、教師なし学習手法の検討によって軽減できる可能性がありますが、後者にはアルゴリズムとパラメータ選択、結果の解釈という課題が伴います。処理時間のさらなる改善は、非常に大規模なデータセットへの適用を考慮する上で必要です。本分類結果は、変形プロセスによる悪影響を軽減するための意思決定や予防的措置において重要な情報源となります。


精度や誤差の評価を除き、ひとまず変動マップの作成まで自動化できるようになります。

文献:Is higher resolution always better?

NHESS - Is higher resolution always better? A comparison of open-access DEMs for optimized slope unit delineation and regional landslide prediction

AI要約

背景 (Background): デジタル標高モデル(DEM)は、地形形態の再現や土砂災害誘発要因の導出、斜面単位(SU)の区画において、土砂災害研究に不可欠です。DEMの品質は土砂災害予測能力に大きく影響するため、適切なDEMの選択が重要ですが、しばしば解像度やアクセス性のみで選ばれてきました。

手法 (Methods): 本研究は、イタリアのマルケ地域で、土砂災害感受性評価のための最適なDEMとSUパラメータを特定することを目的としました。 フェーズ1では、ALOS、COP、FABDEM(グローバルDEM)とTINITALY(国内DEM)を、高解像度航空ライダー(参照DEM)と比較しました。比較基準は、標高差、残差DEM、粗さ指数、SU区画能力などです。 フェーズ2では、フェーズ1で最良とされたTINITALY30mを使用し、SUの最小面積(a)と円形分散(c)のパラメータを調整してSU区画を生成。SUの内部均一性・外部異質性(F)、SU内の土砂災害領域割合(A)、SUあたりの土砂災害密度(D)を統合したSメトリックという新しい最適化手法を提案しました。土砂災害感受性モデルには一般化加法モデル(GAM)が適用され、地形派生変数などが説明変数として使用されました。

結果 (Results): フェーズ1において、TINITALY30mがすべての評価指標で最も優れた性能を示しました。FABDEMはCOPと比較して斜面などの地形派生指標の表現において改善が見られず、TINITALY10mよりもTINITALY30mが優れており、高解像度が必ずしも良い結果を保証するわけではないことが示唆されました。 フェーズ2では、Sメトリックによりa=300x10^3 m^2、c=0.1の組み合わせが最適なSU区画と特定されました。土砂災害感受性モデルの評価指標(AUC、F1スコア、Kappa)はSメトリックの性能とは直接一致せず、訓練データセットのバランスに影響されることが判明しました。

考察 (Discussion): 本研究は、土砂災害研究においてTINITALY30mがマルケ地域でSU定義に最適であることを示しました。DEMは解像度だけでなく、データ品質や目的への適合性が重要であり、高解像度でもアーティファクトがあれば性能は低下します。提案されたSメトリックは、土砂災害の空間的特徴を捉えたSU最適化に有効ですが、感受性モデルの評価指標解釈には訓練データバランスの考慮が不可欠であると結論付けられています。

国内ではLPが公開されていますが、国外ではそうではないのでしょう。DEMの精度を比較し、目的(Landslide Susceptibility 評価)に適したユニット分割が重要とされています。機械学習の観点では、いくつかの解像度を試し良い結果を出すものを選定しますが、これはサイエンスではありません。斜面単位を目的に応じて作成・選定する、というのが求められる手順でしょう。

SU最適化に用いられた指標は以下のとおりです。

AI要約

1. F(アスペクトセグメンテーション指標 / Aspect Segmentation Metric)

 概念: 地形を、類似したアスペクト(斜面方位)特性を共有するピクセルをグループ化することによって分割するという概念に基づいています。

目的: SUの内部均質性(homogeneity)と外部異質性(heterogeneity)を評価するために使用されます。

 計算: 内部均質性を示す局所アスペクト分散 (V) と、隣接するSUの外部異質性を示す自己相関 (I) に基づいて算出されます。

 解釈: F値が高いほど、地形のセグメンテーション(分割)が優れていることを示します。これは、SUの内部は均質であり、隣接するSUとの間には明確な異質性があることを意味します。

2. A(地すべり拡張係数 / Landslide Extension Coefficient)

 概念: SU内で発生した地すべりの総面積のうち、そのSU内に収まっている地すべり面積の割合を合計したものです。

 目的: SUが地すべり領域全体をどれだけ適切に含んでいるかを評価します。

 計算: A = (i番目のSU内の累積地すべり面積の合計) / (i番目のSU内で発生した全地すべりイベントの総面積の合計)。

 解釈: A値が高いほど、SUが地すべり領域全体をよりよく包含していることを示します。理想的には、地すべりの領域がSUの外部に漏れ出ることなく、SU内に完全に収まっている状態が最適とされます。SUのサイズが大きいほど、地すべり全体を包含する可能性が高まる傾向があります。

3. D(地すべり密度係数 / Landslide Density Coefficient)

 概念: 各SUにおける平均地すべり数の逆数です。

 目的: SUの寸法の過大評価を避けるために導入されました。理想的には、SUは単一の地すべりに限定されるべきです。

 計算: 1/D = (i番目のSUで発生した地すべり数の合計) / (不安定なSUの数)。したがって、D値はD = (不安定なSUの数) / (i番目のSUで発生した地すべり数の合計)となります。

解釈: D値が高いほど、SUがより小さい領域に分割され、各SUに含まれる地すべり数が少ないことを意味します。これにより、SUの寸法が過大評価されることを防ぎ、地すべり事象をより正確に表現できます。

 

Sは、上記で説明したF、A、Dの3つの指標を統合した最終指標です。

計算: Sは、F、A、Dの正規化された値の積として定義されます。

 S(a,c) = [(F(a,c)-Fmin(a,c))/(Fmax(a,c)-Fmin(a,c))]
     * [(A(a,c)-Amin(a,c))/(Amax(a,c)-Amin(a,c))]
     * [(D(a,c)-Dmin(a,c))/(Dmax(a,c)-Dmin(a,c))]

 ここで、aはSUの最小表面積、cは地形の最小円形分散を表すパラメータです。

SUが最適と判断されるロジック: S指標を最大化するSUの最小表面積(a)と円形分散(c)の組み合わせが、研究地域におけるSU区画の最適なものと判断されます。 これは、F、A、Dの各指標がそれぞれSUの異なる「良さ」の側面(幾何学的分割の質、地すべり包含の効率、SUサイズの適切性)を評価しているため、S指標を最大化するということは、これらのすべての側面をバランス良く考慮し、総合的に最も優れたSU区画を見つけることを意味します。

簡単に言えば、SUが地すべりモデリングにおいて効果的であるためには、

1. 内部が均質で、隣接するSUとは明確に異なる(F値が高い)

2. 発生した地すべりをできるだけ完全に包含している(A値が高い)

3. 地すべりの寸法を過大評価せず、適切なサイズである(D値が高い) 

という3つの特性を同時に満たす必要があります。S指標は、これらの目標を正規化された積として統合することで、最適なSU区画を特定するための包括的な評価基準を提供します。

**************************************
20260228追記
以下が使用されています。V2で入れ子状態のポリゴンを作成できるようになっています。
Automatic optimization and delineation of nested slope units with r.slopeunits v2.0