2026年6月21日日曜日

文献:Use of MEMS Accelerometer ADXL355 in Microtremor Surveys | IEEE Conference Publication

AI要約
1. 背景
地震調査においてMEMSセンサの活用が期待されています。
従来のMEMSセンサは0.1〜2 Hzの低周波領域における感度が専用ジオフォンに及ばないという課題がありました。本研究では、従来より低ノイズ(22.5 µg/√Hz)なADXL355を用い、微動探査、特にH/V法(中村メソッド)への適用可能性を検証しました。

2. 手法:機器特性の評価と差し引き
機器固有の特性(ノイズ)を正確に把握し、測定データから除去するために以下の手順が取られました。
  • 特性評価(自己ノイズの記録): 微動測定に先立ち、振動のない「ゼロ運動レベル」での計測を、道路から離れた建物の地下(コンクリート基礎上)で70時間にわたって実施しました。
  • 多項式近似: 記録されたノイズスペクトルは滑らかな形状を示したため、これを3次多項式で近似し、センサ固有のホワイトノイズ曲線として定義しました。
  • ノイズの差し引き: 実際の現場で計測された微動スペクトルから、解析の第一段階として、この近似された多項式曲線を差し引くことで、機器特性の影響を排除した純粋な振動成分を抽出しました。
3. 結果
微動の特定: フィルタリング後のスペクトルにより、地盤の自然振動数(約6 Hz)と人工的な振動(8 Hz以上)を明確に区別して特定することができました。

4. 考察
MEMSセンサの周波数応答は、低周波領域において感度が物理的に制限されているため、微弱な深部からの共振を正確に捉えきれない可能性があります。本研究では、0.05〜3 Hzの低周波領域については精度が不十分(不確実)であると判断されました。この帯域でもいくつかの弱いピークが観測されましたが、センサの感度限界に近いことから、信頼性に欠けると判断されました。最終的なH/Vスペクトル図(Fig. 9)において、0.05〜3 Hzの範囲は破線で示されており、この領域の正確な評価には専用の3成分ジオフォンを用いた追加調査が必要であると結論付けられます。

ADXL355とマイコンでH/Vを算出する端末を作成し、スマホから操作できるようにはしました。MEMSですのでノイズの大きさから半分あきらめつつ作っていたのですが、意外とそれらしいH/Vが取れるので調べてみることに。引っかかった文献がこれでした。3Hz以下が難しいというのはそこそこ実体験に合うので、ある程度正しい情報なのだろうと思います。

文献:A Novel High-Frequency Landslide Monitoring Device Based on MEMS Sensors and Real-Time Early Warning Method

A Novel High-Frequency Landslide Monitoring Device Based on MEMS Sensors and Real-Time Early Warning Method

AI要約

1. 背景

地滑りは世界的に甚大な被害をもたらす地質災害であり、特に中国のような山岳地帯では、居住地近くで発生する「小規模ながら大きな被害」を引き起こす突発的な地滑りが深刻な脅威となっています。既存の監視技術(GNSS、InSAR、地中傾斜計など)は一定の成果を上げているものの、「高コスト」「設置の複雑さ」「データ処理の遅延」といった課題があります。特に、衛星測位(GNSS)はサンプリングレートが通常1Hzと低く、崩壊直前の急激な加速フェーズ(数秒〜数分)を詳細に捉えることが困難でした。そのため、低コストで設置が容易、かつミリ秒単位の動態を捉えられる高頻度なリアルタイム監視システムの構築が求められていました。

2. 手法

本研究で開発された GeoMAS (Geological MEMS Alert System) は、以下の技術的特徴を備えています。

  • システム構成: 斜面に設置する「監視ユニット」と、居住区に設置する「アラームユニット」の2ユニット構成です。これにより、物理的な距離(最大5kmのLoRa通信)を利用して避難時間を稼ぐ設計となっています。
  • 高頻度サンプリング: 3軸MEMS加速度計を用い、100〜1000Hzの極めて高い頻度でデータを収集します。これにより、目視では不可能なミリ秒単位の微細な振動や前兆を記録できます。
  • エッジコンピューティングによる高度な信号処理: ウェーブレット閾値フィルタリング(sym8基底)とカルマンフィルターを組み合わせ、環境ノイズを抑制しつつ、加速度から速度・変位を算出する際の積分ドリフトを補正します。
  • パラメータ算出: 加速度、変位に加え、重力成分の空間分解による傾斜角も同時に算出します。
  • 早期警戒アルゴリズム:
    運動強度因子 (y): 加速度の大きさと、異常イベントの発生頻度(時間間隔)を組み合わせた独自の指標を算出します。
    変化率 (y ′ ): y の値を4次多項式でフィッティングし、その微分から変化のトレンドを把握します。
    決定マトリックス: y と ∣y’ ∣ を閾値と比較し、4段階(警報、警告、警戒、安全)のレベルを判定します。また、複数デバイスの情報を統合したリスク指数 (F) による広域評価も行います。
  • 省電力・通信設計: 監視ユニットは20mW以下の低消費電力で動作し、ソーラーパネルとバッテリーで自律運用が可能です。通信は4GとLoRa(自組織ネットワーク)のデュアルモードを採用し、緊急時でも安定した警報送信を維持します。

3. 結果

屋外の大型実験サイトにおいて、人工降雨による斜面崩壊シミュレーションを行い、性能を検証しました。

  • 前兆の早期検知: 目視で亀裂が確認される前の段階で、システムは運動強度因子の異常を検知し、「警戒 (Vigilance)」レベルを通知しました。
  • 警報の発令: 背面に引張亀裂が発生したのとほぼ同時(崩壊の9秒前)に、最高レベルの「警報 (Alarm)」を自動発令しました。
  • 避難時間の確保: 前兆信号の検知から最終的な崩壊まで、システム全体で13秒前に警告を行うことに成功しました。実際の運用では、斜面から居住区までの土砂到達時間を加味することで、さらに長い避難ウィンドウが確保されるとされています。

4. 考察

既存技術との相補性: 本システムは、InSARやGNSSが苦手とする「崩壊直前の過渡的な加速」を捉える能力に長けています。一方で、数ヶ月単位の緩やかな変位の追跡にはGNSSが適しており、これらを統合した「空・宇宙・地上」の共同監視ネットワークの構築が理想的です。
 加速度積分による変位誤差の累積(ドリフト)や、環境変化(雨量など)に応じた閾値の動的調整が今後の課題です。
今後は機械学習を用いた閾値の最適化や、風力・振動発電などのさらなるエネルギー回収技術の導入が検討されています。

崩れる直前1分に焦点を当て、開発されたようです。個人的にはそのコンセプトよりもハードの方が気になりました。ソーラーパネルもLoRaも普及している技術ですが、それをコンパクトにうまくまとめられています。私も手元の機器でこの組み合わせを考えていましたので、参考にさせていただきましょう。

2026年6月20日土曜日

文献:Groundwater pH buffering in carbonate aquifers exposed to high-calcium ash backfill


AI要約
1. 背景
廃止された浅い鉱山跡は、地盤沈下を引き起こし、インフラや公共の安全を脅かす重大なリスクとなります。この対策として、石炭や油母頁岩(オイルシェール)の燃焼副産物である高カルシウム灰( CaO 含有率20%以上の灰)をバックフィルとして地下空洞に注入し、地盤を安定化させる手法が取られています。高カルシウム灰は自己硬化性を持つため、ポルトランドセメントの使用量を抑え、コストと二酸化炭素排出量を削減できる利点があります。
しかし、室内試験ではこれらの灰がpH 12.5 を超える強アルカリ性の浸出水を発生させることが確認されており、地下水環境への悪影響が懸念されてきました。
一方で、世界の陸地の約15%を占める炭酸塩岩は、重炭酸塩(HCO₃⁻)と二酸化炭素(CO₂)の系による強い天然の緩衝能力を持っています。本研究は、実際の炭酸塩帯水層において、この緩衝能力が強アルカリ性のバックフィル浸出水をどの程度抑制できるかを検証することを目的としています。

2. 手法(詳細)
本研究では、室内試験、地球化学モデリング、および2年間にわたる長期的な現場実証実験を組み合わせた統合的なアプローチが採用されました。
  • 現場実験の設計: エストニア北東部の、上部被覆層が10m未満と薄い廃止されたオイルシェール鉱山が選定されました。
  • バックフィル注入: 遊離石灰( CaO )を約 30wt% 含むオイルシェール飛灰を使用しました。これを水灰比 0.65〜0.70 で混合してスラリー化し、計74m3を地下の坑道に注入しました。これにより、10mのテスト区間に平均厚さ約1.6mのバックフィル体が形成されました。
  • モニタリング体制: 注入地点から約10mの距離に、上流側(バックグラウンド用:DH1, DH2)と下流側(影響評価用:DH3, DH4)の計4つの観測井を設置しました。
  • 連続測定: pH、水温、水位を自動センサーにより連続的に記録しました。
  • 定期的サンプリング: 定期的に地下水を採取し、主要イオンや重金属(As, Ba, Cd, Cr, Pb, Se)の濃度を分析しました。
  • 地球化学モデリング: ソフトウェア「The Geochemist's Workbench」を用い、バックフィルから発生したアルカリ性孔隙水が帯水層へ移動する際の化学反応を1D反応輸送計算でシミュレートしました。
  • モデルの設定: 浅い帯水層であることを考慮し、大気中のCO₂と平衡状態にある「開放系」を仮定しました。地下水の移動速度は10 m/日、初期孔隙率は10%に設定されています。
  • 室内浸出試験: 規格(EN 12457-3)に基づき、「新鮮な灰」と「28日間養生して硬化したバックフィル」の両方に対して試験が行われました。なお、硬化した材料は試験前に4mm未満の粒子サイズに粉砕されました。規格(DIN EN 12457-3)によれば、高固形分かつ特定の粒子サイズ以下の材料を対象とした、固液比 2 L/kg および 8 L/kg の2段階バッチ試験です。
  • 得られた成分溶出挙動をモデリングの境界条件として使用しました。
3. 結果
  • pHの変化: 室内試験ではpH 12.0〜12.7 の強アルカリ性が確認されましたが、現場の観測井(10m地点)では有意なpHの上昇は見られませんでした。モデリングの結果とも一致し、アルカリ度はバックフィル近傍で急速に減衰することが示されました。
  • 主要イオンの挙動: 最も顕著な変化は硫酸塩(SO₄²⁻)濃度の増加でした。一方で、カルシウム(Ca²⁺)や重炭酸塩(HCO₃⁻)は、後述する方解石の沈殿に伴い減少する傾向がモデルで予測されました。
  • 孔隙率の減少: モデリングにより、アルカリ性浸出水と地下水の反応で方解石(Calcite)が沈殿し、孔隙率が30日間で10%から約7.5%へと低下することが予測されました。
  • 重金属: 重金属類の系統的な濃度上昇は確認されませんでした。これはバックフィル注入によるpH上昇が限定的であったことも要因の一つと考えられます。
4. 考察
本研究により、炭酸塩帯水層には高カルシウム灰由来の強アルカリを効果的に中和する能力があることが実証されました。
  • 緩衝メカニズム: 地下水に溶解しているCO₂から生成される炭酸が、浸出水の水酸化物イオン(OH⁻)を消費し、方解石として沈殿させることでpHを背景値付近まで低下させます。このプロセスは、大気とのガス交換が容易な浅い帯水層で特に有効です。
  • 水理的障壁の形成: 方解石の沈殿による孔隙率の低下は、バックフィル周辺の透水性を下げ、浸出水の拡散を抑制する「水理的障壁」として機能する可能性があります。
  • 真の環境懸念: 炭酸塩帯水層において、高カルシウム灰の使用による主要な課題はpHの上昇ではなく、硫酸塩(SO₄²⁻)の増加であることが明らかになりました。飲用水源として利用される地域では、pHよりも硫酸塩に焦点を当てたモニタリングと対策が不可欠です。

20年くらい前でしょうか、同じような室内実験結果をシミュレーションの境界条件にしたことを思い出しました。国内ですので指針もなく、理屈が誤っていないことだけが拠り所だったのですが、この論文を見て安心しました。このような規格を知っていたら、もう少し説明性も上がったのかもしれません。

生成AIとオジサンのシナジー

後輩君「表面波の分散曲線を得られない」とのこと。

データの一部を見せてもらいました。
まずはコリレーション。そしてCMP重合。で、位相シフト。Claude に指示したところ、何の問題もなく結果が出ました。彼も Claude を使用して試行錯誤していたのにたどり着けていません。

この差は何なのか?と考えた結果、経験か?となりました。
知識はあっても、不慣れであれば指示が大雑把になるかもしれません。求める答えにたどり着くには、AIの提案に対して細部の判断、方向性のずれの早期修正が必要です。手順、見たい周波数帯、測点の選定範囲、間隔など、基礎知識として点で持っていても、線でつながっていないと適切な指示ができないのでしょう。

以前は基礎知識を習得後、自分でプログラムを組むか市販ソフトの使い方を覚える必要がありました。が、今はそこまで必要ありません。順に何をしたいか、何に気を付けないといけないか、誤っていたら修正させるなど、口頭でそのまま AI に渡せる能力があれば十分です。若い人たちに対しては、ソフトの指導は必要なく、考え方の指導がより重要になっています。もしかすると、オジサンに優しい時代が来たのかもしれません。

基礎知識、ノウハウ、応用力がより重要になっています。オジサンの経験を Skill として記録し展開することで、停滞していた技術の伝承もある程度進むのかもしれません。


2026年6月14日日曜日

生成AIのSkillと研究

Fable5 が使用停止になっている Claude。

UBUNTU では Code を CLI で利用しています。
Windows では GUI?。こちらには Chat, Cowork, Code が含まれています。Chat, Cowork は アカウント共通で、別 PC でも(Chatは)スマホでも同じセッションを扱えます。カスタマイズした skill も共通です。

が、Code の Skill は PC 毎。カスタマイズした Skill とは別です。
plugin も含めて整理すると3系統です。

① アカウント共通のSkill(クラウド型)— Chat / Cowork
保存先: Anthropic アカウント(クラウド)
同期範囲: ログインした全端末で共通。Skill は自分のアカウント専用(プライベート)。Enterprise はオーナーが組織全体へ配布可。
追加方法: アプリ内 Customize > Skills →「+」→ Browse skills / Create skill(Create skill 内で ZIP アップロード)
実行環境: コード実行コンテナ(要:Code execution 有効化 / Settings → Capabilities)
対応形式: 自己完結した単体 Skill のみ。ZIP はルートに Skill フォルダごと入れ、中に SKILL.md。

② PC別のSkill(ローカル型)— Code(Claude Code)
保存先: このPCのファイルシステム。-g 指定時は %USERPROFILE%.claude\skills\、-g なしはそのプロジェクトの ..claude\skills
同期範囲: PCのみ(端末ごとに個別インストール。アカウント同期なし)
追加方法: ターミナルで npx skills add ... -a claude-code(-g=全体 / なし=そのフォルダ(プロジェクト)限定)
実行環境: ローカル

③ Plugin
中身: Skill+エージェント+コマンド+フックの束
保存先: PCの %USERPROFILE%.claude\plugins\(ローカル)
同期範囲: PCのみ(アカウント同期は公式に無し)
追加方法: Claude Code 内で /plugin marketplace add owner/repo → /plugin install 名前@マーケット名
実行環境: ローカル(Claude Code)

node が入っていない PC では、Code に頼めば両方ともいれてくれます。
npx skills add https://github.com/vercel-labs/skills --skill find-skills -a claude-code -g
npx skills add https://github.com/anthropics/skills --skill frontend-design -a claude-code -g
npx skills add remotion-dev/skills --skill remotion-best-practices -a claude-code -g

論文作成に使えそうな Plugin, Skill では、以下が引っ掛かりました。
npx skills add dsebastien/ai-skill-scholar --skill  "*" -a claude-code -g
npx skills add dsebastien/ai-skill-arxiv --skill "*" -a claude-code -g

https://github.com/tam07pb915/ethical-academic-writing
これはclaude.aiでの利用が推奨されています。①クラウド型 Chat / Cowork ZIP 用です。
ダウンロード → claude.ai の Customize > Skills → Create skill でアップロード。
中身は Skill なので、②としても可能。
npx skills add https://github.com/tam07pb915/ethical-academic-writing --skill ethical-academic-writing -a claude-code -g

以下はフックの自動実行が将来的に不安だったので入れていません。が、プラグインの入れ方として残しておきます。
https://github.com/Galaxy-Dawn/claude-scholar/blob/main/README.ja-JP.md

インストール
/plugin marketplace add Galaxy-Dawn/claude-scholar
/plugin install claude-scholar@claude-scholar
/reload-plugins

削除
/plugin uninstall claude-scholar@claude-scholar
/plugin marketplace remove claude-scholar


研究にAIを使わないという選択肢はもうありません。有効な使い方、プロセスが提供されていますし、若い方にとっては標準ツールの一つになっているでしょう。
どう使うかが問われる中で、自分の使い方を模索しつつ、同時に対応も求められている──そのような状況です。




2026年6月9日火曜日

FGAM2

地形も入れたFGAM1よりも、雨だけFGAM2の方が汎化性能が良さそうなので、そちらでコードを動かしてみました。

が、得られた降雨応答局面 F(t, X)がおかしい。崩壊直前より33日前の方が効きが良い。実際は逆です。最初に確率を稼いでおいて、段々減じるような非物理的モデルになっています。



論文では「近い日が効いている」とのことなので、逆転しています。でも、得られた確率はあっている。うーん。
ふと、空間CVの一つを見てるからか!と気づきました。全データ使えばどうか?と思い、予測していた能登も学習データ(紀伊+宮城)に混ぜてみました。
結果はOK。論文通り、近い日も効きました。

mgcvのように省けそうなルーチンが含まれて手数が多くなっているのですが、その割に物理モデルとまでは言えない結果。これなら従来の実行雨量の方がシンプルでは?と思い試してみました。
実効雨量を説明変数にしたロジスティック回帰と、FGAM2 を、同じ学習/検証分割で比較。


半減期が短いほど能登で良い(3日 0.846 > … > 60日 0.770 > 単純累積 0.747)。=最近の雨ほど効く。これは能登の実態に合っています。
FGBM2が合うイベントではなかったのでしょう。

2026年6月7日日曜日

文献:On the use of rainfall time series for regional landslide prediction by means of functional regression

On the use of rainfall time series for regional landslide prediction by means of functional regression - ScienceDirect

コード/データ: GitHub - Vitorecacho/Functional-Regression-Landslide: This is a comprehensive R script designed for Landslide Susceptibility Modeling. It compares Functional Generalized Additive Models (FGAM) against standard Generalized Additive Models (GAM). · GitHub— R言語、`refund` / `mgcv` パッケージ使用

時空間という視点は以前私が寝かせた案の一つ。どのように扱っているのかな?と見れば日本のデータ。これは見なければ、ということで早速AIに投げました。

AI要約

 1. 背景
 降雨誘発型地すべりの早期警戒は、50年以上にわたり降雨閾値に依存してきた。降雨の強度・継続時間・累積量がある臨界値を超えると地すべり発生確率が急増するという経験的・統計的アプローチで、直感的で一般市民にも伝わりやすく世界的に成功してきた。
 降雨閾値は地形特性とは独立に推定され、後段で「掛け合わせ」によって統合されることが多い。しかし統計的には、確率の単純な積で同時確率を求められるのは変数が互いに独立な場合のみ。実際には地形は降雨の時空間分布に強く影響する(植生による蒸発散など)。したがって降雨と感受性は独立と仮定できず、両者の事後的統合は統計的に問題がある。
これを受けて、降雨を感受性モデルに直接組み込む時空間モデリング(space-time modeling)が登場。データを「データキューブ」(平面=空間、高さ=時間)として捉え、地すべりの有無を応答変数とする。
これまでの時空間モデルのほぼすべてが、降雨を時間窓ごとの累積値(スカラー値)に集約してしまい、時系列本来の豊かな情報を失っている。一方、連続した降雨信号をそのまま扱う試みでは、スカラー手法を大きく上回る性能が報告された。
深層学習(LSTM・CNN)の課題:①ブラックボックス性、②大量のラベル付きデータが必要(正確な発生時刻を持つインベントリは希少)、③学習された時間特徴に物理的意味づけができない。
関数回帰(functional regression)の利点:降雨時系列上に滑らかな係数関数 β(t) を明示的に与えるため、「どの時点の降雨が最も効くか」を直接解釈でき、早期警戒システム設計に有用。
Moreno et al. (2025) は関数回帰を試したが、地形+降雨を入れた場合、長い時間窓ではスカラー版と関数版の性能差が消えた。著者らは「これは時系列がわずか6日と短すぎたため」と仮説を立て、より長い時間窓で再検証することを本研究の目的とした。

 2. 手法
 2.1 対象データ(日本の3つの地すべりインベントリ)
国土地理院(GSI)の資料を基に、降雨誘発型地すべりの3事例を使用。

| 地域 | 誘発イベント | 時期 | 地すべりポリゴン数 |
| 紀伊半島 | 台風Talas | 2011年9月 | 1,902 |
| 能登半島 | 豪雨 | 2024年9月 | 1,540 |
| 宮城・福島 | 台風Hagibis | 2019年10月 | 847(土石流・表層崩壊のみ) |

2.2 データキューブの構築
マッピング単位: グリッドではなく斜面ユニット(Slope Units, SU)を採用(`r.slopeunits` + QGISのSZ-pluginで最適化)。
総観測数 64,250 SU(Kii 49,306 / Noto 6,056 / Miyagi 8,888)。不安定SUの割合はそれぞれ3%, 10%, 4%。
静的共変量(5つ): 傾斜(Slope)、断面曲率(Profile curvature)、斜面方位を分解した Eastness / Northness、岩相(Lithology:堆積岩・付加体・火成岩・変成岩の4分類)。すべてGSI DEM等から導出。
動的(関数)予測子:CHIRPS-GEFS による日降水量(予報データ、空間解像度5km)。発生日とその33日前まで=計34日の降雨時系列を、先行降雨(準備的)+誘発降雨を含む形で構築。

2.3 GAM と FGAM
GLM → GAM → FGAM という拡張系列
GLM(一般化線形モデル): 予測子と地すべり発生のlog-odds(対数オッズ)の間に線形関係を仮定する。この線形性が制約となる。
GAM(一般化加法モデル, Generalized Additive Model): 応答変数の期待値を、予測子の滑らかな(非線形の)関数の和で表せるようにしてGLMを一般化する。この滑らかな関数にはスプライン(spline)を用いる。加法構造(additive structure)のため、各共変量の寄与を個別に分離・解釈できる(機械学習のブラックボックス性と対照的)。
指数型分布族の応答を扱え、本研究では地すべり有無を二値(Bernoulli分布)して扱いロジットリンク関数 logit(p) = log(p/(1−p)) で線形予測子を [0,1] の確率に変換する。

FGAM(関数一般化加法モデル, Functional GAM): GAMをさらに拡張し、スプラインのような滑らかな関数項に加えて、関数項(functional term)=予測子そのものが時系列(関数)であるものを組み込めるようにしたもの(McLean et al., 2014)。
降雨時系列に対して回帰でき、地すべり過程に内在する非線形な時間ダイナミクスを表現できる。技術的には各時点での寄与を「ヒートマップ」として捉え、s次元×t次元のパラメータ空間になる。関数項は係数関数(無限次元)と降雨データ関数の L²内積で定義される。無限次元のままでは推定不能なので、K個の基底関数(B-spline)に展開して K次元の有限問題に変換する。

Y(s,t) ~ Bernoulli(p_s,t)

logit(p_s,t) = α + β1·eastness_s + β2·northness_s + γ·litho_s
              + f1(slope_s)          ← 1次元スプライン(基底7個)
              + f2(profcurvature_s)  ← 1次元スプライン(基底5個)
              + f3(precipitation_s,t) ← 2次元スプライン(各次元4基底)=関数項

降雨の関数項は、降雨曲線と各基底関数の積を積分してスカラー共変量 Zik を事前計算し、それを滑らか項としてモデルに投入する(**Penalized Functional Regression, PFR**)。

 2.4 推定
REML(制限付き最尤法)で平滑化パラメータを推定(Rの refund + mgcv バックエンド)。GCV(一般化交差検証)は過小平滑化・局所解の問題があるため不採用。
過学習を防ぐため、係数関数 β(t) の「うねり(wiggliness、2階微分の2乗積分)」に基づくペナルティを課す(平滑化パラメータ λ で適合度と滑らかさのトレードオフを調整)。
基底数 K は有効自由度(EDF)が K より十分小さいことを基準に選択。

 2.5 ベンチマーク(4モデルの比較設計)

| モデル | 降雨の扱い | 地形共変量 |
| FGAM1 | 関数(時系列) | あり |
| FGAM2 | 関数(時系列) | なし(降雨のみ) |
| GAM1 | スカラー(累積値) | あり |
| GAM2 | スカラー(累積値) | なし |

検証戦略: 時間窓を1日ずつ増やして34日まで性能変化を観察。
ランダム交差検証(訓練比率5%〜90%、各100回ブートストラップ)。
空間交差検証(leave-one-inventory-out):2地域で訓練・残り1地域で検証(転移性能を評価)。
評価指標:AUC(カットオフ非依存)、混同行列・TP/TN率(Youden指数でカットオフ設定)、Precision-Recall。

3. 結果
3.1 共変量の効果(FGAM1)
傾斜: ほぼシグモイド状。〜10°は低確率、10〜35°でほぼ線形に確率増加、その後変曲(最大傾斜で確率約0.3)。表層崩壊・土石流という地すべりタイプと整合(緩斜面は安定、急峻すぎると土層が乗らない)。
断面曲率: ほぼ平坦地形でピーク(確率〜0.55)、凸型・凹型では急減。
岩相: 付加体のみが有意に不安定と関連。
方位: 東向き・南向き斜面で不安定性が高まる。
降雨の関数効果: 33日前(day −33)はどんな強度でも発生確率ほぼゼロ。発生日に近づくと確率が急増し、ピークは発生の1〜2日前。3事例とも約3日続いた暴風雨で誘発されたことと完全に整合。

3.2 時間窓に対する性能
GAM2が一貫して最低性能(AUC開始点〜0.73)。
GAM1は地形予測子のおかげで〜0.80から開始。
関数モデル(FGAM1/FGAM2)はスカラー版を上回り、かつ挙動が安定(滑らかに性能向上、特にday −16以降)。GAMは時間窓に対し不規則変動。
GAM1とGAM2の性能差は大きいが、FGAM1とFGAM2の差は小さい。

3.3 データ量に対する安定性
訓練データ割合を変えたときのモデル安定性ベンチマーク。AUCは補集合(検証サブセット)で計算し、手順を100回ブートストラップして箱ひげ図を作成。
FGAMは一貫してGAMを上回り、少ない訓練データで早く性能の漸近線に到達。ランダム交差検証でFGAMはAUC > 0.81(acceptable〜good)を安定維持、GAMは0.81未満。
ランダムCVは過大評価しがち(Anderssen et al., 2006)。隣接SUは地形が類似し降雨も5km格子を共有するため、訓練と検証に近接SUが混在して空間的自己相関で結果が楽観的。 FGAM2は地すべり検出(TP/P, 平均83.8%)でFGAM1(80.7%)よりわずかに高いが、安定斜面の識別(TN/N)では76.2% vs 69.9%でFGAM1が優位=降雨のみのFGAM2はFN(見逃し)を多く出す。

3.4 空間交差検証(leave-one-inventory-out)
| 訓練 | テスト | モデル | AUC | 評価 |
| Miyagi & Noto | Kii | FGAM1 | 0.749 | Moderate |
| Kii & Miyagi | Noto | FGAM1 | 0.681 | Acceptable |
| Noto & Kii | Miyagi | FGAM1 | 0.613 | Acceptable |
| Miyagi & Noto | Kii | FGAM2 | 0.746 | Moderate |
| Kii & Miyagi | Noto | FGAM2 | 0.757 | Moderate |
| Noto & Kii | Miyagi | FGAM2 | 0.723 | Moderate |

FGAM1のAUCは地域により0.61〜0.75(ランダムCVより低い=地域間の一般化は難しい)。FGAM2は3地域すべてで安定して良好(0.72〜0.76)。地形相互作用を入れたFGAM1は日本の多様な地質で性能が落ちることがある。

4. 考察(Discussion)
4.1 支持する論点(強み)
多変量フレームの統計的正当性:感受性評価と降雨閾値を別々に行うのは数値的に妥当でない。多変量回帰は共変量の相互影響を同時推定できる。
解釈性: 統計モデルは回帰係数や確率を直接見ることでモデル自体の理解が得られる。機械学習のLIME・SHAPは事後的(post-hoc)な近似にすぎず、モデル内部の指標ではない。
コンカービティ(concurvity)検証: 加法FGAMが地形(静的)と降雨(動的)の効果を適切に分離できることを確認(降雨0.61/0.35、傾斜0.40等、いずれも0.8閾値以下)。
降雨閾値の概念を継承: 降雨を発生日から遡って累積する手法は従来の降雨閾値と類似で、過去50年の早期警戒の知見を関数回帰に直接統合できる。
運用上の意義: 誤りの種類が重要。FN(見逃し)は人命に直結、FP(空振り)は信頼低下を招く。
予報降雨を使用: あえて観測でなく予報降雨を使い、前向き(forward-looking)に検証。早期警戒システムの要件を満たす設計。

4.2 反対する論点・限界
時間窓の問題: 性能はday −23付近で漸近(GAMはday −29でピーク)。適切な時間窓の定義が未解決の大きな課題。
地すべりタイプ未分類: 3事例は主に表層崩壊・土石流(≒単一タイプ)。タイプ別早期警戒(浅い/深い地すべりの区別)ができず、降雨時系列の地形学的解釈にも制約。深い・大規模な地すべりはより長い時系列が必要と推測(浸透に時間がかかるため)。
データ要件の厳しさ: 高頻度降雨データと正確な発生時刻を持つインベントリが必須。多くのインベントリは時刻が月・季節単位で曖昧。時間的不確実性は係数関数 β(t) にノイズを注入し、特に発生直前の重要な数日で降雨効果を過小評価する。データ希少地域では従来の静的感受性マップ・経験的閾値の継続使用が依然適切。
空間転移の難しさ: Leave-one-out検証(未学習の別地域+別イベントへの転移)で性能が低下(FGAM1で0.61〜0.75)。日本の地質的多様性により、地形相互作用を含むFGAM1は学習データと条件が異なる地域で性能が落ち、降雨のみのFGAM2の方が転移には安定(0.72〜0.76)。

  検証の整理:①ランダムCV=同一イベント内でのSU内挿(リーク込みで楽観的)、②空間CV=未学習の別地域への転移(0.6〜0.76)。
社会・運用的側面: 降雨閾値が今も主流なのはシンプルさゆえ。「○○mm降ったら警戒」は専門知識不要で誰でも理解できるが、関数回帰の確率はそうではない。多くの人に理解される警報ほど従われやすく、結果的にリスク低減につながる。性能だけが最良の基準とは限らず、行政機関・住民との協働による警報設計が必要。

4.3 結論
連続降雨時系列を用いた関数回帰(FGAM)は、スカラー集約モデルより一貫して優れた地すべり予測を与えることを、日本の3事例・多様な交差検証で実証。総合的にはPrecision-RecallでFGAM1が最良。
研究コミュニティに対し、スカラー降雨集約値の慣習的使用を批判的に見直すよう提言。
地域→他地域の転移は性能が落ち(0.6〜0.76)、全国共通の単一式は難しい。転移設定では降雨のみFGAM2が比較的健闘。検証例はまだ少なく、地形・降雨・地すべりタイプを変えた系統的検証が必要。

今後の課題: ①地域差を説明する変数・階層/転移モデルでの汎化、②タイプ別かつ発生時刻精度の高いインベントリでの検証、③降雨の高解像度化・地域別の時間窓最適化、④発生確率(感受性)に加え規模(intensity)・完全なハザードへの拡張、⑤確率出力を行政・住民が受け入れる警報へ翻訳する社会実装。


雨についてはRのライブラリを利用しながら33日前からの崩壊確率を出されてています。実効雨量や近年の機械学習ではもっと前の雨を使いますが、3つのイベントは台風のような短期指標があればよいので、33日とされたのかもしれません。目的が長期なのであれば、違ったイベントで見たいですね。
ランダムCVはリークの可能性があるというのはよく見かけます。汎化の妥当な見積りは空間CV側でしょう。そのFGAM1,2の結果を見ると、地形・地質を加えた効果が相対的に小さい=地形・地質を交えた汎化が難しい→降雨だけの方(FGAM2)がまだ良い、でしょうか。結論を得るには、もう少し地域を増やす必要があるのでしょう。
各地域は1イベントのみのため、「同一地域の“次の”豪雨を当てる(時間的転移)」は本研究では検証されていません。その場合はもっと性能が上がると期待します。

ちょっと雨量の関数化がややこしいのでコードを見てみましょうか。


2026年6月5日金曜日

SPHのGPU化

SPH(粒子法)シミュレーションコードの GPU 化に取り掛かりました。

まずは、土のみ3Dコードから。テストには 斜面崩壊(粒子数77万弱、200,00step)を使用しました。実行環境は Dtransu と同じです。
GPU: NVIDIA RTX 4000 Ada(20GB、CC 8.9)
CPU: AMD EPYC 9754(128 コア)

いくつかの試行を得て、こちらは GPU 版が CPU 版に勝てない結果となりました。
OpenMP  32 / 64 / 128 スレッド 94.4 / 60.3 / 48.0s 
OpenACC 75〜84s 
CUDA Fortran + Thrust(set_box のみ)  41.7〜55.3s  

計算コードの変数を倍精度で計算していたため、FP64律速かつメモリ帯域律速となり、搭載GPU にとって二重に不利、CPU に有利でした。特に処理時間の約45%を占める make_interaction とkernel_correction は、GPU 側で改善できませんでした。粒子のセル順ソートは GPU では悪化、コアレス化は微妙でした。
  
セル分割処理だけはGPUで効果がありました。この処理は整数演算 が主体で、FP64律速にも帯域律速にも縛られなかったのでしょう。
  • セル分割(set_box):空間を格子(セル)に区切り、「どの粒子がどのセルにいるか」の対応表(名簿)を作る処理、近傍探索の前準備です。GPU 化では内部のソートに Thrust の sort_by_key (CUB の基数ソート) を使い、インデックス(cell_id と粒子番号)だけを並べ替えて名簿を作ります(粒子データ本体は動かさない)。これが GPU で効いた処理です。
  • 粒子のセル順ソート(reorder_particles):粒子データ本体そのものを、セルの順番に並べ替えておく「席替え」(50 step 毎)。近くにある粒子をメモリ上でも近くに置き、キャッシュ効率を上げる狙い。set_box内のソートと違い、倍精度の粒子配列を丸ごと移動するため、GPU では悪化しました (CPU ではキャッシュ効果で改善)。
  • メモリアクセスのコアレス化(pair_layout):粒子ペアのデータを GPU が読みやすい並び順に変える。GPU は隣り合うスレッドが連続したメモリを読むと速い(=コアレス化)ので、その並びに合わせる。
セル分割+ソート+コアレス化は DualSPHysics の講義で教えていただいたのを覚えていました。当時はメモリ上の最適配置程度で大きな影響があるとは思わず、ちょっとしたテクニック程度の認識でした。ほかにも、DualSPHysicsでは dx/dw など過去の値に依存しない変数は FP32、累積する変数は FP64 でドリフトを避ける工夫がなされています。

土のみコードは両者を倍精度で計算しており、一部を単精度にすると過去の結果(降伏、流体化の判定)の完全再現が困難。単精度化は周囲の応力均衡を変化させ、隣接粒子の降伏タイミングを次々とずらしていく連鎖を引き起こします。これは避けたいので、今回は速度を犠牲にして見送り。 

今回はここまで。次は、残したFP32化に手を付けるか、良いGPUに入れ替えるか、でしょうか。A100 / H100 クラスの GPU であれば、CPUを超えるかもしれません。

ソフトウェアサポートのカタチ

様々なソフトウェアサポートを利用しています。

近年、電話サポートが少なくなり、メールやチャットが主流になりました。どこも人手不足、コスト改善を迫られているのでしょう。

質は様々。電話サポートは意思疎通が簡単で、短期に問題を解決できます。ユーザーの限られている国内のソフトウェアメーカーや、サポート専門会社、外資系でも特殊なソフトだから実施できるのかもしれません。

ESRI Japan さんは、昔(10年以上前)はレスポンスが早く質も高かった。が、今は AI と1日1回の壁打ちをしているような感覚に陥ります。メールでの返事は1日1回、なので意思疎通ができるまで時間がかかる、帰ってくる内容の質が悪い、問題が解決しない、しかもお高い。AI に聞く方が速くて確実になってきました。
https://phreeqc.blogspot.com/2024/03/survey123-web.html

大手さんほど AI を利用する方向に進むでしょう。が、ユーザーとしては対話がBEST。
立場が逆であればと我が身に引き比べながら、お客様と対話し問題解決を図らなくてはならないとあらためて感じています。

2026年6月1日月曜日

Dtransu のGPU化 その3

テスト環境:CPUが高性能、GPUは中(FP64は低)性能でアンバランス。
GPU: NVIDIA RTX 4000 Ada(20GB、CC 8.9)
CPU: AMD EPYC 9754(128 コア)

1. 密度流 (v2 sample3.dtr, KAN3=2 密度連成) 

流れ:GPU + 粒子追跡:OpenMP  のハイブリッドとしました。
流れ系 (setelm ~48% + solpcg ~28%の self-time) が構造的に並列で GPU 理想形。ここを GPU カーネル化して大幅短縮です。

粒子追跡 MOVE1 連鎖 (~20%) はバケット探索の IF/GOTO  分岐が多く、GPU だと並列効率が落ちました。これは OpenMP スレッドに流す形が BESTでした。

2. 表面流+移流分散 

 一番速かったのは ompacc で、密度流と同じ戦略(流れ:GPU + 粒子:OMP)。全構成中で最大のを記録しました。
surface_flow.f90 (D8 地表水ルーティング) の self-time が ~2.3% しかないため、にここは GPU 化不要、host 常駐で問題なし。残りは密度流と同じハイブリッドという構成でした。


当初、なぜ FP64 が弱い GPU でも速くなったのか不思議でした。AIに聞くと、「典型的な arithmetic intensity(バイトあたりFLOP数)が低い 処理だったから」+「16tだから」とのこと。この辺りをAIに頼るようではまだまだかな。

  • 1要素読むごとの計算量はわずか。演算器はメモリ待ちで遊んでいるので足を引っ張らない。
  • GPUは数千〜数万スレッドを同時に走らせ、メモリレイテンシをスレッド切替で隠蔽。結果、自分の~360 GB/sをほぼ飽和できた。
  • CPU 側の並列効率が悪く、460 GB/sを使い切れず~16t相当で頭打ち。

純 GPU (acc)  が負けるのは、ハードの性能差が大きなこともありますが、分岐の多い粒子追跡が GPU の thread divergence に弱いのも一因。ここをテコ入れするとGPUの方が速くなるかもしれません。なお、途中でSPH の Box Search 手法を取り入れてみましたが、劇的な効果は見られませんでした。
このような計算をしていると、FP64に強いGPUだとどうなるのか、試してみたくなります。

改変コードの公開は配布元が許可されていません。時代の流れでコーディング問題はほぼ解決したので、いずれ配布元でもGPU対応版やMPI版、表流水連携版を公開されると思います。比較は出るまで待ちましょう。

2026年5月22日金曜日

Dtransu のGPU化 その2

Dtransu Ver.2 が手元にあったので、こちらもGPU化に着手。

テストは付属の密度流です。
もともと、OMP対応済みだったので、GPU化のみでした。が、何度かテストするうちに、再現性に劣ることがわかりました。

128tまで実施しましたが、16tで頭打ち。

v1 でも密度流をかけると、同じように再現性を確保できませんでした。テストするモノです。
密度流で PCG の流れが変わるのと、粒子追跡の OMP 化部分が引っかかっているようでした。最終的には v1 で固定しましたが、OMP+GPU の速度は v2 よりやや低下しました。
最初は v2 GPU+OMP でパラスタし、最後に v1 で提出、でしょうか。


2026年5月18日月曜日

Dtransu のGPU化

Dtransu のGPU化を実施。

AIさんがプロファイルをとってくれるので、非常に効率的でした。

RTX4000を使っていたのでFP64性能はイマイチ。それでも、2.5倍速くなりました。次は計算用途も考慮して選択しましょう。

ずっと優先度低で眠らせていた課題。今年の頭に外した途端、解決しました。残りは不連続体+連続体ですが、SPHのGPU化が先ですね。

優先度中:機械学習のスキル増強
優先度低:流体+個体(不連続体+連続体)+振動
優先度低:Dtransu の MPI/GPU 対応
優先度低:地表流+地下水+移流拡散


2026年5月10日日曜日

文献:High-resolution raindrop counting via instantaneous frequency sensing

High-resolution raindrop counting via instantaneous frequency sensing on hydrophobic elastic membranes | PLOS One

AI要約

1. 背景
雨粒の数やサイズを測定する装置であるディスドロメータは、気象観測において重要ですが、従来の装置には課題がありました。高精度な標準機器(JWDなど)は高価で、交流電源や専門知識を必要とするため、広範囲な設置が困難です。
一方で、安価な圧電素子を用いたセンサーは「振幅閾値方式」を採用しており、一度衝撃を検知すると一定時間計算を停止(ロックアウト)するため、時間解像度が低く、連続して衝突する雨粒を見逃したり、小さな雨粒を過小評価したりするという欠点がありました。
本研究は、市販のマイクと疎水性弾性膜を組み合わせ、低コストながらこれらの限界を克服する新しい検知手法を提案しています。

2. 手法
本手法は、振幅ではなく「瞬時周波数」の変化に着目している点が革新的です。

  • ハードウェア構成: 一般的なPVCパイプの片端に、安価なプラスチック膜(PETやHDPEなど)を張り、ドラムのような構造にしています。この膜に雨粒が衝突した際の音をマイクで集音します。
  • 物理的原理: 雨粒が疎水性弾性膜に衝突すると、膜の固有振動(低周波)とは別に、12–18 kHzの非常に短い高周波過渡振動が発生することを発見しました。この高周波信号は雨粒の衝突に特有のものであり、低周波の背景ノイズと分離しやすい特性があります。
  • Acoustic Feature Model (AFM): 音声データから、信号の局所的なピーク(山)と谷の位置を抽出し、ノイズを除去した上で「局所的な周波数推定値」へと変換します。
  • 機械学習 (1D-CNN): AFMで得られた特徴量を、1次元畳み込みニューラルネットワーク(CNN)に入力します。このネットワークは、風などのノイズと雨粒の衝突を判別し、衝突の確率を算出します。
  • 軽量設計: リソースの限られたマイコンやスマートフォンで動作(TinyML)させることを目的としており、モデルのパラメータ数は1000個未満と極めて軽量です。

3. 結果

  • 高い時間解像度: 従来の手法が30ms程度の解像度だったのに対し、本手法は約10ミリ秒の時間解像度を達成しました。
  • 精度: 評価実験において、予測されたイベントの80%~90%が実際の衝突時刻から10ms以内に収まっており、高い精度で雨粒を数えられることが示されました。
  • ノイズ耐性: 振幅を計算に使用しないため、低周波の振幅ノイズ(風など)に対して頑健であり、高い感度を維持したまま背景ノイズの影響を抑えることに成功しました。
  • モデルの有効性: DensenetやResidualブロックを用いたCNNモデルは、基本的なモデルよりもノイズ抑制能力が高いことが確認されました。

4. 考察
本研究の最大の特徴は、材料の物理的な減衰に頼るのではなく、信号処理と機械学習によって時間解像度を向上させた点にあります。

  • 利点と応用: 非常に低コストな材料で構築できるため、教育現場や発展途上国での気象観測ネットワーク、短期間のキャンペーン調査などに適しています。
  • 現在の課題: 強風による高周波ノイズが誤検知の原因となることがあり、さらなるノイズ除去技術や風防の検討が必要です。また、一度の衝突を二重に数えてしまうアルゴリズム上の課題も指摘されています。
  • 今後の展望: 今回は雨粒の「カウント」に焦点を当てていますが、将来的には個々の雨粒の運動エネルギーの推定や、平均的な粒径分布に基づいた降雨強度の算出へと拡張することが期待されています。
  • 未解明の物理: なぜ軟らかな疎水性膜への衝突で高周波振動が発生するのかという微視的な物理メカニズムは完全には解明されておらず、さらなる研究の余地を残しています。

塩ビパイプに膜を張って雨音を計測するだけという、これ以上ない実用的なアイデアです。
パイプのサイズや膜の張力は低周波の共振には影響しますが、検知に用いる高周波過渡振動(12–18kHz)には影響しないとのこと。また、 PETやHDPEといった異なる材質でも同様の信号が観察されています。身近な材料かつDIYによる物理的な製作誤差に対しても極めて高い堅牢性を持っている点が素晴らしい。
機械学習モデルも最初からエッジAI向きに作られています。今後の雨量推定がどうなるか、期待を込めて待ちましょう。


コード整備 その3

おまけです。

 ・振動計
200Hzサンプリング以上にするとデータ保存時にバグっていたのですが、AIに見せると問題点を指摘してくれました。浅いコピーをやめて深いコピー&数を増やすことで問題を回避。500Hzサンプリングでも問題なく保存できるようになりました。

・3次元安定解析
これもAIがバグを発見してくれました。学習量の多いであろうPythonで書いていたためか、割と早く修正が完了しました。正しい部分も怪しそうなところは指摘することもありましたが、そこに注意しておけば、コードの照査にかなり有効です。

・RegionGrow3D
MATLABコードをPythonに変換。近い将来できるようになると思っていましたが、もう既に可能だったとは。
1回目の変換で結果はピクセルベースで86%合致。もう少し詰める必要はありそうですが、なかなか賢い。

全体を通してみると以下のような感触。
◎既存コードを他の言語に変換したり修正したりする。
◎コードの照査
◎WEBサイトの解析
〇新たな実装
〇機械学習の自動化

まだまだ性能が上がっていくのでしょう。楽しみです。


2026年5月9日土曜日

AIがAIを鍛える

GWの間、コア写真から柱状図を作成する機械学習モデルの訓練を、ほぼAIに任せきりにしていました。先日記載したとおり、ほとんど人手を加えず、AIの提案を承認・却下するだけ。最後は、気が向いたときにRQD等のスコアの伸びを確認する程度でした。手をかけなくてもスコアが徐々に伸びていくのは、精神的に楽。連休も終わりましたので、ひとまずここで一区切りとします。

昨年まではモデルをどう構築するか、比較対象としてどれだけのモデルを用意するか、最適化をどう進めるかなどを考えながら自ら組んでいました。これらの作業も、今年からはほぼAIに任せられそうです。相手は人ではありませんから、提案方針に何度ダメ出しをしても気を使う必要はありません。納得がいくまで試行錯誤させることができます。文献収集力や実装の速さは人を上回り、初歩的なミスに目を瞑れば、24時間無休で働いてくれる部下ができたようなものです。

一方で、誰でも機械学習モデルを組める状況になったことで、AI活用そのものを差別化要因とするのは難しくなるでしょう。土木分野でも、画像や動画を使った異常検出や点検、数値データを使った予測といった難しいとまでは言えない作業の自動化があります。これらに投資してきた企業が案件を獲得してきた側面もあります。しかしAIの進化により、誰もが短期間で同等のモデルを構築できる時代になってしまったため、こうした先行投資・利益回収型のビジネスモデルは終焉を迎えつつあるように感じます。短期的には実績がある分、有利な状況が続くとは思いますが。

これからは、より一層アイデアと新規性が求められる時代になるでしょう。発想の豊かな技術者こそが重宝されるはずです。そのためには、基礎力を疎かにしないことが欠かせません。若い方々には、便利なAIを活用しつつ、時間をかけてこそ身につく基礎力を養ってほしいと思います。

2026年5月6日水曜日

文献:A multi-layer SPH method for generic water–soil dynamic coupling problems

A multi-layer SPH method for generic water–soil dynamic coupling problems. Part I: Revisit, theory, and validation - ScienceDirect

AI要約

1. 背景
水と土砂の動的な相互作用は、地滑りや土石流といった自然現象から、防波堤やダムの浸透流といった工学的問題まで、幅広く存在します。これらの現象を数値シミュレーションで扱うには、土砂の大きな変形、水面の自由表面流、そして両相間の複雑な相互作用を同時に扱う必要があります。従来の格子法(有限要素法など)では、大きな変形によるメッシュの歪みや自由表面の追跡が困難でした。一方、SPH法(粒子法)はメッシュフリーであるため、これらの問題に適しています。しかし、従来のマルチレイヤーSPHモデルの多くは、空隙率(porosity)の時間・空間的な変化を正確に考慮していなかったり、流体の体積保存に欠陥があったりするなどの課題がありました。
本研究は、混合体理論に基づき、これらの課題を克服した包括的な3次元数値フレームワークを提案することを目的としています。

2. 手法
本研究で提案された手法の核心は、混合体理論(Mixture Theory)マルチレイヤー(多層)粒子で表現するSPHの実装にあります。
数学的定式化(ADFとIDF): 以下の2つのモデルが提案されました。

  • 仮密度ベース定式化 (ADF): 混合体単位体積あたりの質量(仮密度)を用いる手法。
  • 真密度ベース定式化 (IDF): 各相の実際の材料密度(真密度)を用いる手法。

特にIDFは、空隙率の空間的・時間的な変化を厳密に考慮できるよう、本研究で新たに質量保存則が導出されました。

支配方程式と構成則:

  • 水相: 弱圧縮性ニュートン流体としてモデル化され、状態方程式(EOS)を用いて圧力を算出します。
  • 土砂相: 弾塑性構成則(Drucker-Prager降伏基準)を用い、土砂骨格の変形と有効応力を扱います。
  • 相互作用力: 浮力(buoyancy force)と粘性抗力(viscous drag force)を考慮します。抗力には、層流から乱流まで対応可能なErgunの式に基づいた2次形式が採用されています。

数値的な工夫:

  • 粒子体積の補正: 流体粒子が土砂領域に出入りする際、空隙率の変化に応じて粒子の体積を適切に調整することで、流体の体積保存を確実にします。
  • 補正シェパードフィルタ (CSDF): 粒子の一貫性を確保し、自由表面付近のノイズを低減しつつ滑らかな圧力分布を得るための新しいフィルタ手法が導入されました。
  • 境界条件: 壁面における粒子の貫通防止と、自由滑り/ノンスリップ条件を適切に扱うための一般化境界粒子法が実装されました。

3. 結果
提案されたモデルの妥当性は、複数の検証ケースを通じて確認されました。

  • 体積保存の検証: 水が土砂領域に流れ込む単純な崩壊試験において、粒子体積を補正する手法(VA)が正確な水深を再現できることを示しました。一方で、補正を行わない従来の手法では、流体体積が保存されず不正確な結果となりました。
  • U字管内の浸透流: 空間的に空隙率が変化する土砂を通る水の流れをシミュレーションし、解析解と非常によく一致することを確認しました。また、CSDFの導入により、長時間のシミュレーションでも自由表面の乱れが抑えられることが実証されました。
  • 重力下での沈下: 水中に沈められた土砂に重力が加わる動的な過程を扱い、水圧と土砂の有効応力が最終的に理論的な静水圧分布に収束することを確認しました。
  • 水中地滑りの再現: 実験スケールの水中地滑りをシミュレートし、土砂の堆積形状や、地滑りによって誘発される波(impulsive wave)の形状が実験データと良好に一致しました。

4. 考察
本研究の結果から、以下の点が考察されています。

  • ADFとIDFの比較: 両モデルは数学的には等価ですが、SPHの実装においてはIDFの方が数値的に安定し、精度が高いことが判明しました。これは、ADFが空隙率の変化に対して敏感すぎ、圧力計算にノイズが乗りやすいためです。
  • 統一的なフレームワーク: 提案手法は、純粋な水領域、乾燥した土砂領域、およびそれらが混合した飽和領域を、単一の方程式系で統一的に扱える点が強力です。
  • 今後の課題: 3次元シミュレーションは計算負荷が高いため、GPUによる加速が不可欠です。また、水中地滑りの実験で見られた土砂の急激な体積膨張(細粒分の拡散など)を完全に再現するには、単なる構成則を超えた、水と土砂のより高度な界面混合モデルが必要であることも示唆されました。

密度を変更しないと、計算が複雑にならず理解が楽。IDFがADFに比べて安定であることも実感しました。ただ、地中で体積を膨張させるというのは初期配置が面倒。私は粒子分割・統合で対応しました。発表が2022年ですから、改良案は出ているのかもしれません。


文献:3D semantic mapping of surface geological features

3D semantic mapping of surface geological features - ScienceDirect 

AI要約

1. 背景
地学研究(地形学、災害評価、環境モニタリングなど)において、3D空間上のデータに「岩」「断層」などの意味(セマンティクス)を割り当てるセマンティックマッピングは非常に重要です。しかし、以下の課題が大きな障壁となっていました。

  • アノテーションの困難さ: 数百万点におよぶ大規模な3D点群データに、手作業で正確なラベル(注釈)を付けるのは極めて困難で時間がかかります。
  • トレーニングデータの不足: 地質学分野に特化した、機械学習用の汎用的な3Dデータセットが不足しています。
  • 既存モデルの限界: コンピュータビジョン分野の既存3Dセグメンテーションモデルは、構造化されていない屋外の広大な地質データには最適化されていませんでした。
本研究は、これら「学習データの不足」と「大規模データの処理」という2つの大きな課題を解決することを目指しています。

2. 手法:独自の統合アルゴリズム「SegMo3D」
提案手法の核となるのは、既存の大規模視覚モデル(LVM)セグメンテーション・モザイキング・アルゴリズムの統合です。

  • 2Dセグメンテーション(意味の抽出): ドローン画像に対し、学習不要(ゼロショット)で動作するSAM2を適用し、画像内のオブジェクトを自動で切り出します。さらに、Grounding DINOを併用することで、テキスト(例:「rock(岩)」)による検索・抽出を可能にしました。
  • 3D-2D投影(空間の紐付け): SfM(Structure-from-Motion)を用いて、写真から3D点群を生成し、カメラの位置・向きを推定します。この情報を使い、3Dの点を2D画像上に投影することで、どの点群がどの画像ピクセル(およびセグメンテーション)に対応するかを計算します。この際、手前の物体に隠れた点を除去する「デプスフィルタリング」を適用します。
  • セグメンテーション・モザイキング(新規性の核): 異なる角度から撮影された多数の画像による認識結果を、3D空間で一つに繋ぎ合わせます。
  • 投影フィルタリング済み3D IoU: 異なる視点からの認識結果をマージする際、3D点を一度別の画像平面に再投影して重なりを確認する独自の基準を導入し、視点違いによるノイズを排除しました。
  • 確率的投票戦略: 個々の画像の認識結果をそのまま信じるのではなく、複数の画像からの「証拠」を確率的に集計して最終的なラベルを決定します。これにより、一部の画像で認識ミスがあっても、全体として正確な判断が可能になります。
  • 効率化設計: 計算時間が画像数に対して線形に増えるように設計されており、数千万点規模の膨大なデータも現実的な時間で処理できます。

3. 結果
合成データと実世界のUAV(ドローン)データの両方で検証が行われました。

  • 精度の向上: 合成データ(Kubric)を用いたテストでは、既存の最先端手法(SAM3D、SAMPro3D)と比較して、誤検出(false positives)を大幅に減らし、高い平均精度(mAP)を記録しました。
  • 実世界データへの適応: アリゾナ州の岩壁データ(約1,250万点)において、自立した岩の抽出に成功しました。競合手法のSAM3Dが大規模データに対応できず、データを間引く(ダウンサンプリング)必要があったのに対し、SegMo3Dは高解像度のまま処理を完遂しました。
  • ケーススタディ: 抽出した岩の形状から「高さと幅の比率(脆弱性の指標)」を自動計算し、地震発生時に崩落しやすい岩(PBR:不安定な岩)の脆弱性分布マップを作成することに成功しました。

4. 考察

  • 実用性: 専門的な学習データを用意することなく、既存のSfMワークフロー(Agisoft MetashapeやOpenDroneMapなど)に組み込んで、誰でも高精度な3Dセマンティックマップを作成できる道を開きました。
  • 技術的な進歩: 従来の「下から順に繋ぎ合わせる(エラーが蓄積しやすい)」方式から、複数の視点を統合する「確率的決定」方式へと転換したことで、複雑な地質環境での安定性が飛躍的に向上しました。

今後の課題:

  • メモリ消費: 大規模な関連付けデータを保持するために、非常に大きなRAM容量(実験では約40GB)を必要とします。
  • SfM精度への依存: カメラ位置の推定精度が低いと、空間的なズレが生じます。
  • 2Dモデルの限界: 最終的な精度はSAM2などの2D認識能力に依存するため、地質学に特化した2D学習モデルが登場すれば、さらに精度が向上すると期待されます。

UAV画像による点検にも使えそうです。
voting による視点間のセグメンテーション統合という方法は、見たことがありません。素晴らしいですね。

資料では、不安定な岩(PBR: Precariously Balanced Rocks)が転倒するために必要な最小のPGA(PGA overturning)は下式とされています。

PGA  =1.3g・tan(W/H)

g: 重力加速度
W/H: 幅と高さの比(幅を高さで割ったもの)

この関係性は、地震時のハザード分析や落石リスクの評価に直接活用できるとのことですが、どの程度役立つかは未知。スクリーニングに使う程度でしょうか?落石源としての独立性指標も入ると、より実務で使いやすくなるでしょう。


Dtransu + 地表流 +移流分散

Dtransu に地表流を組み込みました。

以前(といっても10年も前になるのですが)、地表の水頭Pを排除しないように改造していました。それを地表流として平面上で散らすだけです。散らす方法はそろっていますので、あとは組むだけでした。それもAIが頑張ってくれるようになったので、重い腰を上げることに。
https://phreeqc.blogspot.com/2020/05/kinematic-wave-diffusion-wave.html

組んでみると、それなりに谷部には水が流れます。が、思ったほど高くなりません。30mメッシュで 1㎞×1㎞ のテストケースを作っていたのですが、もっと谷部を細かく分割しないと高くなりません。また、表層も薄くしないとPが精度よく出ません。つまり、地下水のみの計算よりもメッシュを細かく切る部分が発生するということです。ま、当然なのですが。
計算時間もかかります。地下水の流れは遅いので dt を飛ばせるのですが、地表流はその間にサブステップを回す必要があります。
濃度では、同じPでも地下水からの湧き出し、降雨による希釈を分離する必要がありました。こちらは組んでいる最中に気が付きました。

組んでは見たものの、思ったよりも計算時間がかかるので実用的でないなあと。また寝かせることになりそうです。

2026年5月4日月曜日

地理空間MCP Server

地理空間情報:地理空間MCP Server - MLIT Geospatial MCP Server - (α版) - 国土交通省

国交省さんが公開されたMCPサーバーです。第一印象は「対応が早い」でした。河川砂防技術基準の学習用データセット公開に続き、これです。今後、さらに展開されるのでしょう。

動画では Claude Code を利用されています。これ、かなり使い勝手が良いので私も利用しています。もうChat に戻れません。

私の勤めている会社は Chat 止まりです。MCPサーバーにアクセスするためのツールはホワイトリストに入っていないため利用できません。が、そのうち対応してくれるでしょう。たぶん。
Office365  もMCP 経由で操作できるようになりましたので、早く業務メールも処理できるようにして欲しいのですが。

コード整備 その2

・ボーリングコアから柱状図作成
以前は手抜きで生成AIに丸投げ。そりゃダメよね、という結果でした。
今回は画像認識、評価を正攻法で積み上げる仕様で着手。古典的な画像処理からSAM2, Dino v2, YOLO8など、何を使うか選択させるところから実装、比較、評価、次の方針提案までをAIさんにお任せ。こちらは出てきた結果を見て方針変更の必要性を適時与えるだけ。手がかかりません。
コア、サンプリング箇所くらいは教師ナシでもXMLから判断できるだろうと思いきや、意外と難しい。仕方がないので少ない教師データを与えるとで適切に学習が進みました。教師データ作成のためのセグメント指定アプリもAIさんに作っていただきました。ありがたや。
まだセグメンテーションが完璧ではなく、その後の評価もまだまだですので方針を変える必要ありかもしれません。が、自動で試行を繰り返してくれるのは(時間がかかっても)手がかからないのでうれしい限りです。

・PCからエッジAIへ
PCで作成した巨大モデルをセンサー側に載せようと思い、方針作成をAIさんに指示。実機が手元になかったのテストまではできていませんが、数時間でプログラム作成までたどり着きました。しかも、上記の柱状図作成と並行で進行。部下を2人得たような気分です。

・過去コードのバグフィックス
過去に書いたコードを読ませてバグを調査。それなりに出てきます。もともと、これが目的の一つで有償AIを利用しているのですから、ありがたいと思うべきなのでしょうが。ま、修正もAIさんにお願いするので、それほど手はかからないか。

AIを利用したコーディングには、ある程度の知識やノウハウを有していた方が効率的です。その点、これまでのコーディング経験は役立つだろうと思います。若い方はノウハウなしで作っているので、また違った感性が育つのでしょう。
1年後、どのようにAIが変化して、技術者が対応するようになっているのか、楽しみです。

2026年5月2日土曜日

コード整備

先月、地方への出張が続いたためか、出不精がより落ち着いて家にこもっています。時間のあるうちに、いくつかのコードとマニュアルを整備することにしました。

・機械学習モデルの利用サンプル
お客様のご依頼で、Pythonを触ったことのない方でも使えるようにブラウザ上で判定させるサンプルモデルを作成。Python 環境を Docker file にまとめ、OSに関わらず動くようにしました。

・水文水質データベースのスクレーパー
国土交通省 水文水質データベースから、以下のデータをCSVファイルとして取得できるようにしました。
  • 観測所一覧 雨量・水位流量・ダム堰
  • 時間雨量 指定観測所の任意期間の時間雨量 [mm/h]
  • ダム諸量 指定ダムの任意期間の流域平均雨量・貯水量・流入量・放流量・貯水率
  • 水位・流量 指定観測所の任意期間の水位 [m]・流量 [m³/s]
このスクレーパーは、後輩さんからの依頼です。以前、Python で似たようなスクリプトを作成していましたが、Pythonを知らない方でも簡単に使えるようにC++へ移植・拡張。すべてブラウザのフォーム操作のみで完結するGUIも作成し、コマンドプロンプトでなくとも動かせるようにしました。
リクエスト間隔を2秒に固定しサーバー負荷への配慮しつつ、取得済みデータはローカルにキャッシュして二度取得しないようにしました。どの程度のアクセス頻度がOUTなのか判断できなかったため、公開は控えています。

・SPH 土ー水連成
Drag Force を考慮した2相2層でのコードを整備。もともと書いていたコードに対し、以下の点を変更しました。 
  • IDF(Peng 2022)への移植 — 水相を intrinsic density rho_tilde で記述し、自由水-飽和土界面の数値不整合を解消。ベースライン定式化を置換し、以後の全機能の土台に。
  • 境界条件の刷新 — mDBC(English 2022) へ統一(Shepard ghost + hydrostatic 補正)。
  • 数値安定化レイヤ追加 — Tait γ=7において、Riemann 圧力拡散(Zhang 2017)、δ-SPH 拡散、Bonet-Lok カーネル補正、HHT-α 積分を追加。
最も効いた改編はIDF 移植でした。
上記以外にもAIに多様な文献を集めさせて実装し試しています。便利な時代になったのですが、それら棄却した内容に対する理解が追い付いていません。復習が必要です。

つづきます。

2026年4月27日月曜日

AI コーディング

AIの助けを借りてコーディングし始めたころも「すごい」と思いましたが、今はAI主導でコーディングできるようになっています。あらためて「すごい」。これから何度驚かされるのでしょうか。

1年ほど寝かせていたコードですが、2週間ほどで問題点を見つけ、概ねそれらしく動くようになりました。その間、次々に露呈する問題に対して対策を施した文献を探し、実装し、試行したのはAIさんです。1年前と比べても、文献収集力、試行錯誤の効率が段違いです。仕事で使わない手はありません。

この時代、学生さんから見たら、AIを使ってもプログラムを書けないオジサンは老害に見えるかもしれませんね。経験ベースのオジサンたちが古いやり方を踏襲しようとすると、それだけでハラスメント?になるかもしれません。時代は繰り返す、でしょうか。昔も今も、このような構造は変わらないのでしょう。

さあ、コーディング問題は片付いたも同然です。寝かせていた子たちを起こしていきましょう。

文献:Surface-wave dispersion spectrum inversion method applied to Love and Rayleigh waves

Surface-wave dispersion spectrum inversion method applied to Love and Rayleigh waves recorded by distributed acoustic sensingDAS surface-wave inversion | Geophysics | GeoScienceWorld

AI要約

1. 背景(問題点)

DASの特性と制約: DASは既存の光ファイバー網を利用して高密度な空間サンプリングを低コストで実現できる技術ですが、標準的な直線状ケーブルでは主にケーブル軸方向の動的ひずみを記録します。
波の分離の困難さ: 軸方向の成分のみを記録するという特性上、レイリー波とラブ波を分離することが困難です。
従来手法の限界: 従来の表面波解析(分散曲線解析)では、震源とケーブルを一直線上に配置する「インライン」観測で得られる純粋なレイリー波(またはラブ波)のみを扱うのが一般的でした。
クロスラインの問題: 震源がケーブルの延長線上にない「クロスライン」配置では、レイリー波とラブ波が混在して記録されるため、標準的な手法では正確なモデル化ができませんでした。これを解決するために特殊なケーブルやアレイを用いると、導入コストが大幅に増大するという課題がありました。

2. 手法

本研究では、分散曲線を抽出する代わりに分散スペクトル(周波数-位相速度領域)を直接インバージョンする手法を提案しています。
データ処理(観測スペクトルの構築)
スラントスタック法: 多チャンネルの記録をフーリエ変換で周波数領域に変換し、位相速度を仮定した位相シフトを与えて重ね合わせることで、分散スペクトルを構築します。振幅の変動を抑えるための正規化も行われます。

フォワードモデリング(理論スペクトルの生成)
モード集約法(Modal Summation Method): 推定された地下構造モデル(Vs,Vp,ρ、層の厚さ)に基づき、各受振器位置における放射方向(radial)と横方向(transverse)の変位記録を算出します。
DAS記録への変換: 計算された変位を、震源と受振器の方位角に基づいてケーブル軸方向の変位へと線形結合します。
ひずみとゲージ長の考慮: 得られた変位記録に1次中心差分を適用することで、DASが記録する「動的ひずみ」へと変換します。この差分をとる距離が実際のDASのゲージ長に対応します。
スペクトル化: この理論波形に対しても観測データと同様のスラントスタック法を適用し、理論的な分散スペクトルを生成します。

最適化
遺伝的アルゴリズム(GA): 観測スペクトルと理論スペクトルの差(二乗平均平方根誤差)を最小化するように、遺伝的アルゴリズムを用いて最適なS波速度(Vs)モデルを全域的に探索します。

3. 結果

数値シミュレーション: クロスライン配置(混合波)のデータからでも、インライン配置と同等の精度でVs構造を復元できることが確認されました。
低速度層(LVL)の検出: ラブ波に含まれる低周波成分が追加の制約を与えるため、レイリー波単独(インライン)の解析よりも地下深部や低速度層を正確に復元できることが示されました。
実データへの適用: ネバダ州の地熱地帯(PoroTomoプロジェクト)のアクティブ震源および環境ノイズ(NCF)データに適用した結果、異なるデータセットや観測配置の間で一貫性のある地下構造モデルが得られました。

4. 考察

観測設計の柔軟性: 本手法により、震源を必ずしもケーブルの直線上に配置する必要がなくなり、既存の通信用光ファイバー(ダークファイバー)を活用した調査が容易になります。
データ利用効率の向上: 従来は解析が困難だった混在信号を有効活用できるため、利用可能なデータ量が増大し、より高解像度な地下イメージの構築が可能になります。
パラメータ感度:密度の不確実性が解析結果に与える影響は5%未満と極めて限定的です。
P波速度(Vp) については、未固結堆積物では影響が小さいですが、固結した岩盤では誤差が最大20%に達する場合があるため、必要に応じてVp も同時にインバージョンに含めるべきです。
ロバスト性: スラントスタック法はインコヒーレントなノイズを抑制する効果があり、10〜20%程度のノイズが含まれるデータや、10〜15度程度の地形勾配がある場合でも、浅部構造については安定した結果が得られます。

分散曲線を抽出する必要がなく、また Love, Rayleighを気にしなくて良いので、叩く位置をファイバーから外せます。微動計の上を叩いているようなもので、すぐに飽和しちゃいますからね。
この程度ならすぐに組めそうです。

2026年3月28日土曜日

地上開度 その2

久しぶりに地上開度を求めることになりました。

以前の記録を見ると、15年ぶりです。その間、利用することはありましたが、自分の手で作ることはありませんでした。

ArcGIS pro v3.6 を確認しましたが、未だ作成機能は実装されていません。国外製品に実装されないということは、国内限定の指標なのでしょう。

今回は python でArc 用のツールボックスを作って計算してみました。
で、上記 QGIS v3.40  (アドイン:Processing Saga NextGen Provider) との結果の比較段階で、相違に気づきました。

SAGA の Morphometric Protection Index は仰角(水平からの上向きの角度 [radian])です。地上開度(鉛直からの角度)に変換すると、水平:MPI 0度→開度90度となります。水平から下向きの見下ろし角は無視されているため、痩せ尾根や山頂などでも最大90度、平野や滑走路のような広い水平場所でも90度となります。
一方で、地上開度の論文では水平から下向きまで考慮されており、90度以上の値をとります。

NoData 周辺の取り扱いも注意が必要です。特に池や湖。今回は1探索方向の全セルが NoData の場合は90度に設定し、その後に8方向平均をとりました。その方向の探索をやめるとか、8方向平均をとらずに NoData 扱いにするとか、いくつかの考え方があると思います。どのような処理をされたデータなのか、確認が必要です。

15年前はこれらの点に気づいていませんでした。もらった開度データに関しても、どの範囲をとっていたかまで見ていませんでした。今回のように論文を見て実装するなど、手を動かさないとダメでした。
基本、開度を自動で計算できるツールは存在していませんので、頂くデータに関しては、作成手法とデータの範囲に留意しましょう。

*********************************************
20260329 追記
地上開度を計算するArcGIS  pro 用の Python toolbox (.pyt) を GitHub の Public リポジトリに置きました。

2026年3月23日月曜日

文献:Real-time lithology identification while drilling based on drilling parameters analysis with machine learning

Real-time lithology identification while drilling based on drilling parameters analysis with machine learning | Geomechanics and Geophysics for Geo-Energy and Geo-Resources | Springer Nature Link

AI要約

1. 背景
石炭鉱山における災害(斜面崩落、ガス突出など)の防止やガス抽出の効率化には、正確な地層(岩相)情報が不可欠です。従来の技術では、技術者が掘り屑(カッティングス)の色や形状を目視で確認していましたが、精度が低く、個人の経験に依存するという課題がありました。近年、振動、音響、画像解析を用いたAI手法も研究されていますが、地下の過酷な環境やノイズの干渉により、実用化には至っていませんでした。特に、「ドリルストリングの摩擦抵抗」が掘削データに与える影響や、膨大なデータのリアルタイム処理が、機械学習を導入する上での大きな障壁となっていました。

2. 手法
研究チームは、以下のハードウェア、前処理技術、機械学習アルゴリズムを組み合わせたシステムを構築しました。

掘削機(スマート掘削リグ): MWD(Measurement While Drilling)システムを搭載した自走式スマート掘削リグを開発しました。姿勢制御、ロッド操作、遠隔制御の各サブシステムを備え、掘削データを自動的に記録します。また、地下のリグと地上のワークステーションを専用ネットワークで結ぶ遠隔データ処理プラットフォームにより、大規模なデータのリアルタイム解析を可能にしました。

前処理:
高速データ検索: 掘削ステータスを14のコード(掘削、ロッド接続など)に分類し、膨大なデータから有効な掘削情報を即座に抽出します。
摩擦検知と補正: ドリルストリングの座屈(バックリング)安定性解析を行い、座屈が起きない条件下でビットが岩石を破壊していない時の負荷を計測して、摩擦抵抗を自動検知します。
データクリーニング: 部品の起動・停止時に発生する「衝撃」などの無効な信号をフィルタリングして除外します。

機械学習手法: 複数のアルゴリズムを組み合わせる「ソフト投票型アンサンブル学習」を採用しました。個別の識別器として、SVM(Quadraticカーネル)、決定木(Medium Tree)、KNN(Fine KNN)、ニューラルネットワーク(Bilayered NN)の4つを統合し、それぞれの予測確率の重み付き平均から最終的な結果を出力します。

説明変数(入力パラメータ): 補正後の推力(Thrust)、トルク(Torque)、および貫入速度(ROP)、回転数(RPM)の4種類を使用します。

目的変数: 石炭 or 岩石(2値分類)

識別結果の継続性を分析(10セットごとのデータ群で判定)することで、さらに精度を高める手法を導入しています。

3. 結果
識別精度: アンサンブル学習モデルは、テストデータに対して98.79%という極めて高い岩相識別精度を達成しました。
掘削効率の向上: 識別された岩相に合わせて掘削パラメータ(回転数や推力)を最適化した結果、従来のシステムと比較して純掘削効率が18.12%向上しました。
省人化: 従来3人で行っていた作業を1人に削減できる可能性を示し、コスト削減と安全性の向上に寄与しました。

4. 考察
本研究の鍵は、ドリルストリングの摩擦をリアルタイムで検知し、掘削データを補正したことにあります。これにより、地層情報とパラメータの相関性が大幅に強化されました。また、地上と地下をシームレスに結ぶデータプラットフォームが実用性を支えています。
 一方で、課題も残されています。現在のモデルは単一のデータソースに基づいているため、地質条件が大きく異なる地域への適用には限界があります。今後は、掘り屑の画像や掘削振動など、複数の情報を統合した「マルチソース情報」による学習を行うことで、汎用性と精度のさらなる向上が期待されています。

TBM, ドリルジャンボなどと同様に、ノンコアボーリングでもトルクや速度をロギング可能であれば、このような使い方ができるのでしょう。地質を知りたい場合はボアホールカメラを後で挿入すれば良いだけです(実際、数m~10mピッチでノンコアボーリングを実施し、ボアホールカメラから柱状図を作成した経験があります)。ボーリングの数を必要とする場合には、有効な手段でしょう。

機械学習よりも掘削機の方が主要な成果です。既にデータさえあれば分析ができる環境が整っていますので、あとは良いデータを集めるだけですから。


文献:Automated geotechnical logging of core box images using machine learning

Automated geotechnical logging of core box images using machine learning: CIM Journal: Vol 16 , No 1 - Get Access

AI要約

背景
地質工学的な不確実性を低減するためには、信頼性の高いデータの量を増やすことが不可欠です。しかし、初期段階のプロジェクトでは、高品質な地質工学用ボアホールの数は限られており、大部分を占める探査用ドリルのデータは品質が不安定なRock Quality Designation (RQD)などに限定されています。また、探査用の実物コアは、分析のために分割されたり、経年劣化や廃棄によって利用できなくなることが多く、コア写真のみが唯一の信頼できる情報源となることが多々あります。従来のコア写真の再ロギングは、時間がかかるだけでなく、ロガー(記録者)の主観やバイアスに影響されやすいという課題がありました。これらの課題を解決し、大量の既存コア写真を客観的かつ効率的にデータ化するため、機械学習を用いたワークフローが開発されました。

手法
機械学習手法: ディープラーニングの一種であるMask_RCNN(畳み込みニューラルネットワーク)が使用されています。これは、画素を自動的に分類・グループ化して特徴マップを作成し、分類を行うモデルです。

前処理:50〜100枚程度のコア画像に対し、各カテゴリーを表すセグメントをポリゴンで囲んでラベル付けを行います。データセットはトレーニングセットと検証セットに分割され、モデルの評価と調整が行われます。
コアの列を特定し、画像を直線化(リニアライズ)して深度を参照するための別のモデルも利用します。

説明変数(入力データ): コア箱のカラー写真です。一貫した照明と色バランスで撮影された写真が、トレーニングに適しています。

目的変数(分類指標): 以下の3つのシステムが開発されました。
Core Damage Index (CDI): コア径に対する砕屑物の平均サイズに基づき、岩盤の状態を5つのカテゴリーに分類します。

  • クラス1: 砕屑物のサイズがコア径の2倍より大きい(> 2x)。従来のRQD(岩質指標)に相当する良好な状態です。
  • クラス2: 砕屑物のサイズがコア径の1〜2倍(1 - 2x)。SCR(固体コア採取率)に相当します。
  • クラス3: 砕屑物のサイズがコア径の0.5〜1倍(0.5 - 1x)。
  • クラス4: 砕屑物のサイズがコア径の0.25〜0.5倍(0.25 - 0.5x)。
  • クラス5: 砕屑物のサイズがコア径の0.25倍未満(< 0.25x)。これには角礫(breccia)、砂、ガウジ(gouge)などが含まれます

Pseudo-RQD(擬似RQD): コア画像上の割れ目と破砕帯(ラブルゾーン)をマッピングして計算されます。自然な不連続面(割れ目)と掘削時などの機械的な破壊を区別しないため、従来のRQDと区別するために「Pseudo」と呼ばれています。
Break Frequency(割れ目頻度): Pseudo-RQDと同様に、割れ目の数から推定されます。

ポストプロセッシング: 5cm未満の間隔のフィルタリング、同じクラスの連続する間隔の結合などのクレンジング処理を経て、以下を表形式でエクスポートします。

  • ホール名(ボアホールID)
  • 開始深度・終了深度(インターバル)
  • 割り当てられたクラス(CDIクラスなど)
  • 該当するコア写真への参照

Leapfrog Geoなどのソフトウェアにこれらのデータをインポートすることで、以下のような高度なモデリングが可能になります。

  • 地質工学ドメインモデルの構築: 抽出されたCDI(コア損傷指数)やPseudo-RQDデータを、地質、構造、岩盤、水理地質の各コンポーネントモデルを構築するためのインプットとして使用します。
  • 断層帯の詳細なモデリング: CDIは5cm単位という非常に高い解像度でデータを生成できるため、断層の核(コア)と損傷帯(ダメージゾーン)を明確に区別し、断層の幅を正確に3D空間で評価できます。
  • 岩盤の変動性の可視化: 従来の1.5m間隔のRQDでは捉えきれなかった岩盤内の細かな品質変化を、3D空間上で連続的に表現できるようになります。

結果
高解像度なデータの取得: CDIを用いることで、従来の1.5m間隔のRQDロギングと比較して4倍以上の高解像度で地質工学的特徴を捉えることが可能になりました。

客観性の確保: ロガーの主観を排除し、砕屑物サイズという客観的な基準で分類することで、一貫したデータセットを構築できました。

損傷の識別: 掘削時の機械的な損傷と、断層核や断層損傷帯のような地質学的な損傷を区別しやすくなり、構造モデリングや水理地質モデリングに貢献するデータが得られました。

考察
客観性の重要性: 機械学習は、主観的な入力が増えるほど、信頼性を維持するために必要な学習データ量が指数関数的に増加します。そのため、RQDのような主観的な判断(自然な割れ目か機械的な破壊かの区別など)を伴う指標は、自動化には不向きであると指摘されています。

デジタル化の限界: コア写真からは岩石の強度や、画像に現れない微細な割れ目の表面状態などを特定することはできません。したがって、この自動ロギングは経験豊富な技術者による詳細なロギングを完全に置き換えるものではなく、既存の膨大なデータを補完するためのツールとして位置づけられます。

モデルの汎用性: 特定の堆積物や条件に過剰適合(オーバーフィッティング)することを避けるため、分類システムを一般化し、客観的な基準(コア径に対する砕屑物サイズなど)を採用することが、信頼性の高いMLモデル構築の鍵となります。

まず思ったのは、オペレータさんによってコアの品質が異なるため、実務に適用するには壁があるだろうな、という点でした。毎回腕の良い、費用の高いオペさんに掘ってもらうことはできないのでしょう。時々、ボロボロのコアに出会うことがありました。
品質を保ちつつ利益を出すというのは企業にとって当たり前のことですが、担当者レベルになるとExecutivesからの圧力もあり、利益が優先される場合があります。これに盾突いて品質を優先する技術者は(程度にもよりますが)、まず民間企業では偉くなれません。結果、利益や株主優先の企業が出てくるのでしょう。

3次元モデラーに入力できるようにしている点は、さすがです。疑似RQDなど、やや品質が落ちたとしても、多数の孔のデータを自動マッピングできるのは基図としてはありがたいと思います。AIに解釈させた結果を提示させるのではなく、画像上の客観的事実のみをAIにより高解像度で提示させたら、後は技術者の仕事です。おかしな点は技術者がログをまとめるなり、モデリングするなりの過程で気づくと思います。

多くのボーリングを整理する必要に迫られた場合、なかなか有向かもしれません。

2026年3月22日日曜日

文献:Machine learning for drill core image analysis

Machine learning for drill core image analysis: A review - ScienceDirect

AI要約

1. はじめに:鉱物探査におけるドリルコアの重要性と機械学習の台頭
世界的な原材料需要の増加、特に再生可能エネルギーへの移行に伴う戦略的原材料の確保が急務となる中、鉱物探査プロセスの効率化が求められています。ドリルコアは、地下の地質状態を物理的に保存した最も直接的な記録であり、その解析(ロギング)は探査の根幹をなします。
近年、このドリルコア写真をデジタルデータとして機械学習(ML)で解析する試みが急速に進化しています。ドリルコア写真は、低コストかつ迅速に撮影可能で、岩相、変質、鉱物、層序、地盤工学的特徴といった多様な視覚的指標を保存しているため、MLの入力データとして非常に魅力的です。

2. 機械学習が取り組む3つの主要な地質学的タスク

① 岩相予測(Lithology Prediction)
岩石の種類(砂岩、大理石、玄武岩など)を分類するタスクで、最も研究が進んでいます。
手法と精度: 畳み込みニューラルネットワーク(CNN)が主流であり、ResNetやGoogLeNetなどのアーキテクチャを用いた研究では、90%から96.7%という極めて高い正解率が報告されています。
技術的アプローチ: 多くの場合、ImageNetで学習済みのモデルをドリルコアデータで微調整する「転移学習」が用いられます。
課題: 砂岩と石灰岩のように視覚的に酷似した岩石の判別には限界があり、人間による化学テスト(塩酸反応など)を代替するには至っていません。

② 地盤工学的解析(RQD/FS推定)
岩盤の品質指標(RQD)や亀裂間隔(FS)を推定するタスクです。
成果: モデルによる推定誤差は手動測定に対して±2.5〜3%以内に収まり、処理速度は人間の約1800倍に達する可能性があるとされています。
汎用性: 亀裂や破砕帯といった構造的特徴は、岩石の種類よりも普遍的なパターンを持つため、最も自動化や汎用化に適した領域と考えられています。

③ 鉱物予測(Mineralogical Prediction)
画像テクスチャ(質感)から特定の鉱物の含有量や品位を推定します。
手法: 従来のテクスチャ記述子(LBPやGLCMなど)を用いる手法と、CNNを用いる手法があります。
複雑性: 鉱物学的性質は微視的なスケールで決定されることが多いため、画像というマクロな視覚情報から推測するこのタスクは、3つの中で最も抽象度が高く困難です。

3. 技術的・実務的な主要課題と議論
研究レベルでの高精度とは裏腹に、実務への完全導入にはいくつかの大きな壁が存在します。

汎用化の壁(Generalization): ある現場で学習したモデルを別の現場や地域に適用すると、精度が著しく低下します。これは、同じ岩相でも地域によって見え方が異なるためです。
データの一貫性と主観性: 地質学者が作成する「正解ラベル」自体に主観が含まれており、専門家間でのラベル不一致(label non-agreement)がモデルの学習を阻害しています。
データの不均衡: 自然界では特定の岩相や希少鉱物は少なく、データが偏っているため、稀なケースをAIが学習しにくいという本質的な問題があります。
スケールの不一致: AIが数ミリ単位で予測を行うのに対し、地質学的な解釈はメートル単位の連続性を重視します。このギャップを埋めるための「予測結果の平滑化(smoothing)」などの後処理が重要視されています。

4. 将来展望:自動化から「コンテキスト認識型アシスタント」へ
ヒューマン・イン・ザ・ループ(HITL): AIが予測を行い、不確実な箇所のみを人間が修正し、その結果をAIが再学習する「地質学者・イン・ザ・ループ」のサイクルが提案されています。これにより、現場固有の文脈(コンテキスト)を効率的にモデルに教え込むことができます。
コンテキスト認識: 空間的な地質モデルや層序学的な知識をMLの制約条件として統合することで、「古い岩石の上に若い岩石があるのは不自然」といった地質学的妥当性を持った予測が可能になります。
ベンチマークの必要性: 異なるモデルを公平に比較するため、多様な地質環境を網羅した「標準的なデータセット群(ベンチマーク・スイート)」の構築が提案されています。

結論として、機械学習は地質学者の仕事を奪うものではなく、解釈の矛盾を指摘したり、膨大なルーチンワークを高速化したりする「高度な助手」へと進化していくことが期待されています。

ルレオ工科大学(スウェーデン)の研究者を中心とし、スウェーデンの大手鉱業企業であるBoliden Mines の実務家が加わった、学術界と産業界の多角的な専門家チームによって執筆されています。レビューなので新たな知見や目新しい手法がないのは仕方ありませんが、それでもHITLの方針はやや残念。いえ、私も(手を抜いて)失敗しましたし、現状では納得なのですが、この壁を破る必要があります。ま、要素ごとに解決して組み合わせる、いずれ丸っとログを吐かせるなどの手法は時間の問題でしょう。
https://phreeqc.blogspot.com/2025/04/blog-post.html

さらに、TBMのようにボーリングマシンでもデータをとれるような仕組みを考え、そのデータを柱状図作成用の機械学習モデルに取り込み、3次元地質モデルを推定させる段階までは、近い将来可能でしょう。要素技術としては既に存在するため、難しくはないと思います。

国内ではこのようなコアに対する機械学習モデルやデータセットを公開しようといった動きを聞きませんし、機械学習自体を使えない技術者たちが Executives になりつつあるため、当面は遅れたままでしょう。ビジネスチャンスではあるので、フットワークの軽い企業は文献に紹介されているような要素技術を商品として宣伝を始めるでしょう。そういった企業がやがて地質の機械学習に関する老舗となり、時代が追い付いた段階でに優位に立てるのかもしれません。


2026年3月21日土曜日

文献:Automated classification of drill core photographs

Automated classification of drill core photographs: A complete workflow for weakly supervised training - ScienceDirect

AI要約

1. 背景
鉱物探査において、地質学者がコアを視覚的に検査することは伝統的な手法ですが、分類が部分的で主観的になりやすく、専門家によって結果が異なるという課題があります。近年、深層学習(CNNなど)を用いた自動予測が注目されていますが、学習に必要な大量のラベル付きデータを作成するには多大な時間と労力が必要です。本研究は、最小限のラベル付けで効率的に岩石を分類できる完全なワークフローを構築することを目的としています。

2. 手法
本手法は、以下の5つの手順で構成されています。

前処理 (Preprocessing)
レンズ歪み補正: 広角レンズによる「樽型歪み」を補正し、その後の直線検出の精度を高めます。
コア箱の分離: 木製のコア箱から岩石コア部分を分離するため、Cannyエッジ検出やモルフォロジー演算(膨張、収縮、オープニングなど)を用います。
細分化 (Slicing): 分離されたコア画像を、解析に適した標準的なサイズ(300×60ピクセル、実寸約18cm長)に分割します。

機械学習手法

自己組織化マップ(SOM)によるクラスタリングとラベル付け
SOMは、高次元のデータを視覚的に理解しやすい低次元(通常は2次元)の格子状マップに変換する「トポロジー保持型」の無向ニューラルネットワークです。
仕組みと構造: 抽出された96個の特徴量(色記述子48個、テクスチャ記述子48個)を入力として使用します。これを10×10(合計100個)のニューロン格子に投影します。
トポロジーの保存: 色や質感が似ている画像は、マップ上でも物理的に近いユニットに配置されます。この性質により、数万枚の画像を1枚ずつ確認するのではなく、似た画像が集まった「クラスター」ごとに効率よく処理できます。
効率的なラベル付け: 地質学者は各ノードから代表的な画像(例:各ノードからランダムに選ばれた5枚)を確認し、そのクラスター全体に対して「漂白」や「片麻岩」といった地質学的なラベルを割り当てます。これにより、数時間という短時間で、数千から数万枚規模の学習用データセットを作成することが可能になります。

深層学習モデル:ベースラインとVGG16
ベースラインモデル (Baseline Model):
本データセットに合わせて開発されたシンプルな3層の畳み込みニューラルネットワーク(CNN)です。
構造: 3つの畳み込みブロック(サイズ32, 32, 64の3×3カーネル、ReLU活性化関数)で構成され、各層の後にバッチ正規化とマックスプーリングが適用されます。最後にソフトマックス活性化関数を持つ全結合層が配置されています。
VGG16: ImageNetデータセットで事前学習された、13層の畳み込み層と5層のマックスプーリング層を持つ非常に深く複雑なアーキテクチャです。
手法: 転移学習(Transfer Learning)のアプローチを採用し、最後の全結合層のみを今回の岩石データで訓練しました。
比較の結果: いずれの地質ドメインにおいても、複雑なVGG16よりもシンプルなベースラインモデルの方が高い精度を示しました。

半教師あり学習(Mean Teacher)
ラベル付きデータが不足している場合に、ラベルのない大量の画像を有効活用して学習の安定性と精度を高める手法です。
「生徒」と「教師」の2モデル構造: 同じ構造を持つ「生徒(Student)」モデルと「教師(Teacher)」モデルを使用します。
一貫性コスト (Consistency Cost): 同じ画像に対して、それぞれ異なるランダムなノイズ(輝度変化や反転など)を加えて両方のモデルに入力します。「滑らかさの仮定(Smoothness Assumption)」に基づき、小さな摂動(ノイズ)を加えても予測結果は変わらないはずであるため、2つのモデルの予測結果の距離(平均二乗誤差:MSE)を一貫性損失として計算し、これを最小化するように学習します。
重みの更新: 生徒モデルは通常の学習(損失関数の最小化)を行いますが、教師モデルの重みは、生徒モデルの過去の重みを指数移動平均(EMA)で反映させることで、より安定した「smoothed(平滑化された)」モデルとして機能します。
利点: 特にサンプル数が極端に少ないクラス(例:ダイアテクサイト)や、複雑な結晶質岩(基盤岩)の分類において、精度の向上に寄与しました。

説明変数 (Explanatory Variables / Features)
色情報: 3Dカラーヒストグラム(RGB空間)から抽出した512個の記述子を、主成分分析(PCA)で48個に圧縮して使用します。
テクスチャ情報: ガボールフィルタ(Gabor filters)を用いて、24通りの畳み込み演算から平均と標準偏差を算出し、計48個の特徴量を取得します。

目的変数 (Objective Variables / Target)
地質学的ドメインごとに以下のクラスを設定しています。
盆地(堆積岩): 漂白(Bleached)、部分除去(Partial removal)、ヘマタイト化(Hematized)、非コア(Non-core)。
基盤岩(結晶質岩): 片麻岩(Gneiss)、メタテキサイト(Metatexite)、ダイアテクサイト(Diatexite)、ペグマタイト(Pegmatite)、非コア。

評価関数 (Evaluation Function)
教師あり学習: カテゴリカル・クロスエントロピーを損失関数として使用します。
半教師あり学習: 教師あり損失(クロスエントロピー)と、教師モデルと生徒モデルの予測の一致度を示す「一貫性損失(MSE:平均二乗誤差)」の合計を最小化します。

3. 結果
盆地サブセット: ベースラインモデルを用いた教師あり学習で、0.932という最も高い分類精度を達成しました。
基盤岩サブセット: 半教師あり学習(Mean Teacher)を採用したベースラインモデルが0.751の精度で最高の結果となりました。
いずれのケースにおいても、複雑なVGG16よりシンプルなベースラインモデルの方が高い精度を示しました。

4. 考察
精度の差: 基盤岩の精度が盆地より低いのは、岩相の複雑さ、特定のクラス(ダイアテクサイト)のサンプル不足(40サンプル)、および変成度の変化が連続的でクラス間の境界が曖昧であるためです。
バイアスの軽減: SOMを用いたクラスタリングにより、地質学者の主観による「オペレーター・バイアス」を一貫したアルゴリズムで補完し、再現性の高い分類が可能になります。

今後の展望: 照明条件の統一や、Segment Anything Model (SAM)のような高度な画像分割手法を導入することで、さらなる精度の向上が期待されます。

まだコアを分けるという段階で、柱状図を作ることはできません。ラベリングの手間をなくすためにクラスタリングを利用するという主張はよく見ますが、経験的には正確ではない場合が多くあります。いずれも発展途中なのでしょうが、いずれ解決すると思います。


文献:Direct inversion of surface wave dispersion

Direct inversion of surface wave dispersion for three-dimensional shallow crustal structure based on ray tracing: methodology and application | Geophysical Journal International | Oxford Academic

AI要約

背景
表面波トモグラフィーは、地球の地殻や上部マントルの構造を研究する上で重要な役割を果たしてきました。従来の一般的な手法は、まず観測された走時データから2次元の位相速度(または群速度)マップを作成し、次に各地点の分散データのインバージョンにより1次元の横波(S波)速度プロファイルを求めるという、2段階のプロセスを踏みます。しかし、この手法や従来の直接反転法では、多くの場合、大圏コース(Great Circle)伝播を仮定しており、複雑な構造を持つ地殻浅部などでは、波の伝播経路の歪みが無視できず、推定結果にバイアスが生じる可能性がありました。一方で、波形全体を用いるフルウェーブフォームインバージョン(FWI)やアジョイントトモグラフィーは高精度ですが、特に高周波数帯域において計算コストが非常に高いという課題があります。

手法
本論文で提案された手法は、中間的な速度マップを作成せず、分散データから直接3次元のS波速度構造を求める単一ステップのインバージョン法です。主な特徴は以下の通りです。

Fast Marching Method( FMM) によるレイトレーシング: 各周期において、FMMを用いて震源・受信点間の走時と波の伝播経路を計算します。これにより、不均質メディアにおける大圏コースからの経路の逸脱を考慮することが可能になります。

反復的な更新: 反転プロセスにおいて、新しく得られた3次元速度モデルに基づいて、波の経路とデータ感度行列(カーネル)を逐次更新します。

ウェーブレット基底を用いた疎性制約付き反転: モデルパラメータをウェーブレット領域で表現します。ウェーブレット変換の多重解像度特性を利用し、データ制約が強い地域では高解像度を、制約が弱い地域では長波長の特徴を保持するようにします。

L1ノルム正則化: ウェーブレット係数がまばら(スパース)であると仮定し、L1 ノルム正則化を適用します。これにより、従来の滑らかさを強制する正則化よりも、データの分布に適合した適応的な解像度が得られます。

計算アルゴリズム: L1ノルムベースの最小化問題を解くために、反復再重合最小二乗法(Iteratively Reweighted Least Squares: IRLS)とLSQRアルゴリズムを組み合わせて使用しています。

物性間の関係: P波速度(α)と密度(ρ)は、地殻に関する経験的な関係式(Brocher, 2005)を用いてS波速度(β)に関連付けられており、これらによる分散への影響も感度行列に含まれています。

結果
台湾の台北盆地における、環境ノイズ相関法から抽出された短周期(0.5〜3.0秒)のレイリー波位相速度データにこの手法を適用しました。

計算の収束: 反復的な反転により、走時残差の標準偏差は1.44秒から0.91秒に減少し、残差の平均はほぼゼロになりました。

速度構造の解明: 盆地内の低速度域と山地(大屯火山群など)の高速度域が明瞭に描き出されました。これらの結果は地表の地質構造と良好に一致しています。

従来手法との比較: 従来の2段階反転法の結果と概ね一致しましたが、データ網羅性が低い地域では、本手法の方がアーティファクトが少なく、より安定した結果が得られました。

解像度テスト: チェッカーボードテストにより、データ制約が良い地域では水平・垂直方向に高い解像度を持つことが確認されました。

考察
提案手法は、計算効率と精度のバランスに優れており、特に構造が複雑な地殻浅部の調査に有効です。

利点: 2次元速度マップの構築が不要であり、3次元参照モデルの組み込みが容易です。また、ウェーブレット基底の採用により、データの密度に応じてモデルの細かさが自動的に調整されます。

限界と仮定: 現状では高周波近似(レイ理論)に基づいており、滑らかな不均質構造を想定しています。

今後の展望: 有限頻度効果(Finite-frequency effects)を取り入れた感度カーネルの導入や、実体波(P波・S波)の走時データとの共同反転(Joint Inversion)への拡張が期待されます。これにより、地殻浅部におけるP波・S波両方の速度構造をより正確に制約できる可能性があります。

こちらも、数式を追うのに時間がかかりました。パスを計算する点や、1次元のインバージョンを介さないという点が新鮮です。



2026年3月18日水曜日

文献:3D Wave‐Equation Dispersion Inversion of Distributed Acoustic Sensing Data


AI要約
3D波動方程式分散インバージョン(3D-DAS-WD)法の解析手順
3D-DAS-WD法は、DASひずみデータに直接基づく3D波動方程式分散インバージョン手法であり、ひずみ成分を速度に変換する際の数値誤差を回避し、低SNR(信号対雑音比)のDASデータにおけるFull Waveform Inversion(FWI)の収束問題に対処することを目的としています。この手法は、浅い地表付近の地質構造を高分解能で3Dイメージングする能力を示しており、地下の空洞などの特徴を効果的に特定できます。

1. DASの基本原理とデータ取得
• DASの測定原理: 従来の地震計が粒子速度を測定するのに対し、DASは光ファイバーのゲージ長に沿ったひずみ速度を測定します。

2. 初期S波速度モデルの作成
• 解析の出発点として、初期S波速度モデルを準備します。このモデルは、反復的なインバージョンプロセスを通じて改善されていきます。

3. 予測ひずみ速度DASデータの順モデリング
• 作成した初期S波速度モデルを用いて、forward modeling を実行し、予測されるひずみ速度DASデータを生成します。この研究では、スペクトル要素法に基づく弾性モデリングコードSPECFEM3Dが使用されています。
• 計算される速度成分は、式(14)および(15)を使ってDASひずみ速度成分に変換されます。

4. 観測データと予測データの分散曲線の導出
• MASW として分散曲線を作成します。
• 分散曲線は、linear Radon transform を用いて計算された分散スペクトルの最大値に基づいて抽出されます。
• この研究では、各ショットから10度間隔で分散曲線が抽出されます。

5. 目的関数の定義と勾配の計算
• 目的関数(Objective Function): 3D-DAS-WD法は、観測された波数κobs (θ,ω)と予測されたDASデータ表面波分散曲線κ(θ,ω)の二乗差の合計を最小化します。目的関数Jは以下のように定義されます: 
J = (1/2) ∑θ ∑ω (κ(θ,ω) − κobs (θ,ω))^2
ここで、θは方位角、ωは周波数です。

• S波速度に対する勾配: S波速度s(x)に対する目的関数の勾配δ(x)は、以下の式で計算されます: 
δ(x) = ∂J / ∂s(x) = ∑θ ∑ω Δκ(θ,ω) (∂κ(θ,ω) / ∂s(x))

• Fréchet 微分の導出: Fréchet 微分 (∂κ(θ,ω) / ∂s(x)) は、予測データと観測データのk-ω領域における相関を示す接続関数(connection function)Φを用いて導出されます。これは、随伴状態法(adjoint state method)を使用して計算されます。最終的にS波速度 s を λ (ラメの第一定数) と μ (剛性率) に関連付けることで、Fréchet 微分が導出されます
∂κ(θ,ω) / ∂s(x)
 = − (1/A) R{∫ ∂D(g,ω)/∂s(x) D̂*obs(g,θ,ω) dg} 
 = − (1/A) R{∫⟨GR ∂u(g,ω)/∂s(x), D̂obs(g,θ,ω)⟩ dg}
= − 4ρs (∂κ(m) / ∂λ) + 2ρs (∂κ(m) / ∂μ) 

・∂κ(m) / ∂λ、∂κ(m) / ∂μは、 波場u(m)(合成地震計データ)とバックプロパゲーションされた残差u'(D̂∗obs(g,θ,ω)をソースとする)の内積の積分として表される。

6. 速度モデルの更新
• ステップ長の決定: safeguarded backtracking line search method を用いて、モデル更新のためのステップ長αが決定されます。
• モデルの反復更新: S波速度モデルは、計算された勾配とステップ長αを用いて、steepest-descent formula により反復的に更新されます。 ここで、

7. 収束判定と最終S波速度モデルの出力
• ステップ3から6のプロセスは、目的関数が指定された誤差閾値以下になるか、または最大反復回数に達するまで繰り返されます。
• 収束条件が満たされた後、最終的なS波速度インバージョンモデルが出力されます。

さすがにAI要約のみでは理解できず、数式を追うのに時間がかかりました。
DAS(1軸センサー)を利用して、どのようにレイリー波を取り出すか、取り出した後、どのようにインバージョンをかけると精度が落ちにくいか、という内容でした。地震分野の知識の蓄積を感じる文献です。
3次元解析を目的としてファイバーをクロスで張るなら、通常のピックを使った方が楽なように感じましたが。ま、一つの方法として覚えておきましょう。

2026年3月10日火曜日

文献:Classification of Stream Hyperconcentrated and Debris Flow

Classification of Stream, Hyperconcentrated, and Debris Flow Using Dimensional Analysis and Machine Learning - Du - 2023 - Water Resources Research - Wiley Online Library

AI要約

1. 背景
山岳地帯における極端な降雨は、土石流、高濃度流、常流といった激しい土砂流動を引き起こし、人命やインフラに深刻な脅威を与えます。しかし、これらの流動メカニズムの理解は、包括的な現場データの不足により不完全な状態にありました。従来の分類基準は主に体積堆積物濃度(Cs )に基づいていましたが、研究者によってその閾値が異なり、物理的な流動特性を必ずしも正確に反映していないという課題がありました。そのため、測定可能な水理・地形学的パラメータを用いた、より普遍的で客観的な分類手法の確立が求められていました。

2. 手法
本研究では、現場観測データと機械学習を組み合わせた物理的根拠に基づく分類フレームワークが採用されています。

前処理(無次元解析): 異なる地質や地形条件を持つサイト間のデータを比較可能にするため、観測データを無次元化しました。粒子衝突、流体粘性、乱流応力などの相対的重要性を評価するため、アインシュタイン数(無次元土砂流量)、サベージ数、バグノルド数など、計11個の無次元パラメータが算出されました。

機械学習手法: 分類アルゴリズムとしてサポートベクターマシン(SVM)が使用されました。特に、対数空間での境界を定義するために、べき乗則(パワーロー)カーネル関数に相当する対数変換を用いた非線形検索アルゴリズムが採用されています。

説明変数: 流動動態を最も効果的に反映する変数として、無次元流量(q∗  )とアインシュタイン数(無次元土砂流量、qs,∗  )の2つが選択されました。

1) データの収集源
現場観測データ: 中国の蒋家溝(Jiangjia Ravine)で1960年から2014年にかけて記録された5,085件の土石流データ、および小江(Xiaojiang River)で2009年から2010年に観測された34件の常流データが使用されました。

文献データ: アジア、アメリカ、ヨーロッパ、オセアニアの41の流域から、高濃度流および常流に関する1,035件のデータが収集されました。

2) 正解ラベル(流動タイプの分類)の付与
機械学習(SVM)の学習に不可欠な「どの流動タイプか」というラベル付けは、元の観測記録や文献における専門家の知見および現場観察の結果に基づいています。本研究では、それらの既存の分類が正確であると仮定して教師データとして採用しています。

3) 特徴量の作成(無次元化処理)
収集された生の観測データ(流速、水深、川幅、勾配、粒径など)をそのまま使うのではなく、異なる地形や地質条件でも普遍的に扱えるよう、11種類の無次元パラメータへと変換されました。

4) データの活用と検証
作成されたデータセットを用いてSVMによる境界の画定が行われました。なお、ラハール(火山泥流)のデータに関しては、SVMの境界作成(学習)には使用せず、得られたモデルの妥当性を確認するための検証用データとして独立して扱われています。

目的変数: 土石流(Debris flow)、高濃度流(Hyperconcentrated flow)、常流(Stream flow)の3つです。

3. 結果
境界の定義: q∗ とqs,∗ のフェーズダイアグラムにおいて、SVMにより各流動タイプを分ける2つのべき乗則境界(上部境界UBと下部境界LB)が導き出されました。

上部境界(Upper Boundary, UB)
分類: 土石流(Debris flow)と高濃度流(Hyperconcentrated flow)を区分します。この境界より上の領域では、粒子同士の衝突応力が流動動態を支配する土石流となります。
qs,∗ =0.12q∗^1.05
精度: 真陽性率(TPrate)0.999、F1スコア0.999と、極めて高い精度で土石流を識別可能です。

下部境界(Lower Boundary, LB)分類: 高濃度流(Hyperconcentrated flow)と常流(Stream flow)を区分します。この境界より下の領域は、土砂が主に水相の剪断力や乱流によって支持・輸送される「流体支配型」の流動(常流)となります。
qs,∗ =0.07q∗^0.96
精度: 真陽性率(TPrate)0.915、F1スコア0.891であり、上部境界に比べるとわずかに分類の曖昧さが残ります。

ラハールへの適用: 火山性の土砂流動であるラハールにこのフレームワークを適用したところ、ラハールは常流から土石流まで極めて広い範囲の流動動態を示すことが確認されました。

4. 考察
輸送メカニズムの違い: 土石流は主に粒子同士の衝突応力によって制御されるのに対し、高濃度流と常流は流体の粘性剪断や乱流応力によって土砂が支えられていることが物理的に裏付けられました。
堆積物濃度基準の限界: 、従来の堆積物濃度(Cs)のみに基づく基準では動的な流動特性を無視しており、誤解を招く可能性があります。判別が困難だった領域(0.1<Cs<0.4 など)においても、流動特性を反映した明確な分類が可能となりました。
提案された無次元流量-土砂流量スキームは、水理情報をより多く取り込み、輸送メカニズムをより効果的に反映できると結論付けられています。
実用性: このフレームワークは、現場での流量や流速の測定値から即座に流動タイプを判定できるため、砂防ダムの形式選定(土石流用のスリットダムか、洪水用の不透過ダムか)など、適切な防災戦略を立てるための定量的な参考指標となります。

観測値に基づき、無次元の特徴量を作成し、機械学習にかける。Traditional な SVM ですが、解釈性を優先することで上部境界、下部境界を見出すことが可能です。検知だと最適化に陥りがちですが、ドメイン知識を有する研究者らしい機械学習の使い方で、データサイエンスと呼べるのではないでしょうか。





2026年3月9日月曜日

文献:Radar‐Based Deep Learning for Debris Flow Identification

Radar‐Based Deep Learning for Debris Flow Identification Amid the Environmental Disturbances - Liu - 2025 - Geophysical Research Letters - Wiley Online Library

AI要約

1. 背景
土石流は、山岳地帯において甚大な経済的損失や人的被害をもたらす地質災害です。
従来の監視技術には、降雨量しきい値による警戒や、地中音センサー、ビデオ監視などがありますが、これらには課題があります。例えば、小流域における降雨情報の不確実性や、機器の埋没リスク、視界の悪い夜間の監視の難しさが挙げられます。マイクロ波レーダーは、昼夜を問わず全天候型で遠隔監視が可能という利点がありますが、土石流の信号を環境ノイズの中からインテリジェントに識別する手法は十分に研究されていませんでした。本研究は、深層学習モデルとレーダー技術を組み合わせることで、複雑な環境下での土石流識別精度を向上させることを目的としています。

2. 手法
人工実験によるデータ収集: 自然な土石流の観測データが不足しているため、研究チームは中国の甘洛県にある黒西洛溝(Heixiluo Gully)などで計30セットの人工土石流実験を実施しました。
再現方法: 斜面に長さ約9メートル、勾配約15度のチャネルを掘削し、大量の緩い土砂を含む急流を作ることで、土石流の動きを徹底的にシミュレートしました。
制限事項: 実験的な土石流は「スケール効果」などの要因により、現実世界のシナリオと完全に一致させることは難しい。しかし、モニタリングと早期警戒の観点からは、人工的な土石流であってもレーダーのエコー信号を生成できるため、有効なサンプルとして使用しました。

前処理: ビデオ記録とレーダーソフトウェア(Radarexplore)のキャプチャデータに基づき、土石流や落石の移動時間範囲を特定し、異常値を手動でフィルタリングしました。その後、PythonとOpenCVライブラリを用いてビデオフレームを抽出し、各ターゲットにつき3,000個のサンプルを作成しました。深層学習モデルへの入力として、画像は短辺256ピクセルにリサイズされた後、中心部が224×224ピクセルにクロップされ、テンソルの正規化が行われました。

機械学習手法: 12種類の広く利用されている深層学習モデル(VGG16、ResNet18、GoogLeNet、Wide_ResNet50_2など)が採用されました。転移学習の考えに基づき、各モデルの事前学習済みモデルに対して30エポックの訓練が実施されました。さらに、個々のモデルの不確実性を最小限に抑えるため、多数決に基づく投票戦略(Voting Strategy)が導入されました。

説明変数: レーダー信号から変換された2次元のエネルギースペクトラム(画像データ)が説明変数として使用されました。これはドップラー周波数とエコー強度を waterfall graph 形式で可視化したものです。

本研究の waterfall graph:
横軸: 1,024の速度クラス(移動ターゲットのドップラー周波数に対応)。
縦軸: 距離ゲート(range gates)。距離情報を表すために各ゲートが積み重ねられています。
色(スケール): エコー信号の強度(信号の強さ)。
約3 Hzの頻度で出力されます。
グラフの各水平ラインは特定の時間ステップにおけるドップラー演算結果(ドップラースペクトル)に対応しています。距離ゲート(距離ごとの区切り)を垂直方向に積み重ねることで、「どの距離で、どの程度の速度の物体が、どれくらいの強さで存在するか」を一枚の画像に可視化しているため、これを waterfall graph やエネルギースペクトラムと呼んでいます。

目的変数: 以下の8つのターゲットカテゴリです:(A)水流、(B)土石流、(C)タルチョ(祈祷旗)、(D)自然の谷、(E)車両、(F)落石、(G)植生、(H)動物(ヤク)。

3. 結果
実験の結果、すべてのモデルにおいてマルチオブジェクト分類に対する高い能力が示されました。
分類精度: 個別のモデルでは Wide_ResNet50_2が最高の精度95.46%を達成しました。GoogLeNetやResNet18も95%を超える高い精度を示しました。
土石流の識別: 土石流の識別においては、VGG16が非常に優れた性能を発揮し、高い適合率と低い誤報率(false alarm rate)を記録しました。
投票戦略の効果: 投票戦略を用いることで、個々のモデルよりも信頼性が向上し、特に土石流や落石の誤検知率をさらに低減させることができました。

4. 考察
本研究は、レーダー技術と深層学習、特に豊富な実地データを組み合わせることが、土石流などの自然災害の監視と早期警戒において重要な進歩であることを示唆しています。従来の統計的な手法から、データ駆動型のモデルへの移行が有効であることが証明されました。 一方で、本研究にはいくつかの制限事項も指摘されています。まず、土石流と落石のデータは主に現地での人工的な実験によって収集されたものであり、実世界の規模(スケール効果)とは異なる可能性がある点です。また、レーダー信号を用いた土石流の移動メカニズムの解明には、さらなる詳細な実験と分析が必要であるとしています。総じて、本手法は複雑な山岳地帯における災害監視能力を大幅に強化する可能性を秘めています。

地上レーダーは高価なので、なかなか検知には利用できません。安価なレーダーは距離が不足。これも時間が解決すると思いますが。
LiDARよりも雨に左右され難いので、いずれテストを通過して検知に使われるようになるでしょう。


文献:Deep-Learning-Based Object Detection and Tracking of Debris Flows in 3-D Through LiDAR-Camera Fusion

Deep-Learning-Based Object Detection and Tracking of Debris Flows in 3-D Through LiDAR-Camera Fusion | IEEE Journals & Magazine | IEEE Xplore

 AI要約

背景
土石流は水と堆積物の混合物であり、山岳地帯で年間平均1,275人の死者を出す深刻な自然災害です。土石流の内部構造やエネルギー消散などの挙動を理解するには、流体中の個々の物体(巨石、流木、段波など)の動態を詳細に分析することが不可欠です。しかし、最新のセンサー(LiDARやビデオカメラ)は1イベントあたり約1TBもの膨大なデータを生成するため、手動での識別や追跡は極めて困難であり、リアルタイム監視や大規模データ解析のための自動化手法が強く求められていました。

手法
スイスのイルグラーベン(Illgraben)観測所にてデータを収集。画像データに対し、Label Studio(オープンソースのラベリングプラットフォーム)を使用し、専門家の監修のもとでバウンディングボックスを付与しました。

機械学習手法:
物体検出アルゴリズムとしてYOLOv5およびYOLOv8(特に複雑度の高いxバージョン)を採用しました。フレーム間の個体追跡(トラッキング)にはSORTアルゴリズムを使用しました。

説明変数:ビデオカメラ(AXIS P1448-LE)からの2次元光学画像、およびLiDAR(Ouster OS0/OS1)からの3次元点群データです。
目的変数(区分とラベル付けの判断根拠): ドメイン知識を持つ専門家が動画を確認し、物理的特性や進化状態に基づいて以下のクラスに分類・ラベル付けを行いました。

小型特徴物 (Small Features: SF): 速度プロファイルの推定を目的として区分。
巨石 (Boulders): 土石流フロント付近に集まる大きな岩。
転石 (Rolling Boulders): 流体中を転がりながら移動する岩。
流木 (Wood): 水面に浮遊し、表面速度を代表する物体。
段波 (Surge Waves: SW): 波の進化過程を分析するため、動画上の視覚的特徴から以下のように区分。
拡散型 (Diffuse): 前面が滑らかで、砕波(波の崩れ)が見られない波。
砕波型 (Breaking): 波の前面が崩れ、泡立っているような状態の波 。
ハイブリッド型 (Hybrid): 波の中央部は拡散しているが、流路の端(岸付近)で砕波している混合状態の波 。
※誤検出を防ぐため、波が含まれない画像(ネガティブ画像)も学習に含め、土石流の「フロント」を「段波」と誤認しないよう調整されています。

LiDARとビデオカメラを融合させた、土石流の3次元解析パイプライン
1. キャリブレーション(事前準備)
カメラ画像(2D)とLiDAR点群(3D)を数学的に統合するため、ターゲットベースの手法を用います。
剛体変換の算出: チェッカーボードを両方のセンサーで同時に計測し、カメラとLiDARの相対的な位置関係(回転行列と並進行列)を特定します。
歪み補正: 正確な投影を行うため、あらかじめカメラレンズの歪みを補正しておきます。

2. 2次元画像での物体検出とSORTによる追跡
まず、識別能力の高いビデオ画像(2D)側で処理を開始します。
YOLOによる検出: 深層学習モデル(YOLOv5またはv8)を用いて、画像内の巨石、流木、段波をバウンディングボックスで囲みます。
SORTアルゴリズムの役割: 検出された個々の物体に固有IDを付与し、フレーム間での同一性を維持します。これにより、単なる「点」の検出を「連続した軌跡(トラック)」として捉えることが可能になります。また、背景の誤検出は連続して追跡されにくいため、SORTが偽陽性を排除するフィルタとしても機能します。

3. 3次元投影(視錐台の形成)と位置特定
画像上の2D枠を3次元空間へ投影し、LiDAR点群と紐付けます。
視錐台(Frustum): カメラの焦点を頂点とし、2D枠の四隅を通って伸びるピラミッド状の3次元空間を定義し、その内部にある点群のみを抽出します。
高さへの対応: 位置特定にはLiDARが直接計測した3次元座標(x, y, z)を使用します。カメラ単独では「高さがある物体ほど手前に見える」という視差(パララックス)による平面位置の誤認が生じますが、本手法では点群のz座標を直接参照するため、物体の高さや形状が変化しても正確な平面位置を取得できます。

4. 物理量の自動算出
抽出された3次元データから、以下の物理量を10Hzの頻度で算出します。
位置・速度: 物体の代表点(小型特徴物はボックス中心、段波は下辺中点)の移動を時系列で計算し、3次元の速度ベクトルを導き出します。
波の幾何形状: 点群の流路横断方向における2次導関数(曲率)を計算し、値が最大となる場所を波の頂点(Crest)として特定します。この頂点と、事前に計測した河床データとの差分から、正確な波高(Hb)を算出します。

このパイプラインにより、手動計測の300倍以上のデータ量(1イベントあたり約1,000件の軌跡)を自動で取得することが可能となりました。

結果
検出精度: 段波(SW)検出器はmAP 0.9以上、小型特徴物(SF)についてもmAP 0.7以上という優れた性能を達成しました。
データ量の飛躍的向上: 自動追跡により約1,000件の物体軌跡を取得し、これは従来の手動解析の300倍以上に相当します。
労力削減: 異なる地点のデータを活用する「マルチドメイン学習」により、新しい観測地点への適応に必要なラベル付けの労力を75%以上削減できることが示されました。
科学的発見: 段波が物体を加速させる現象を定量化し、また海岸工学を応用して土石流の段波が砕ける閾値(砕波指数)が0.4であることを特定しました。

考察
モデル選定: YOLOv5は精度で僅かに勝りましたが、YOLOv8は検出速度が5倍以上速いため、リアルタイムの早期警戒システムにはYOLOv8が適している可能性があります。
追跡の役割: SORTアルゴリズムによる追跡は、背景の誤検出を排除する強力なフィルタとして機能し、解析の信頼性を高めています。
物理的挙動の解明: 流木が転石よりも速く移動する傾向の観測は、土石流内部に「剪断(深さ方向の速度低下)」が存在することを示唆する重要な知見です。
実用性: このパイプラインにより、1イベントあたり約250時間の作業時間が節約されると推定され、今後の土石流ハザード評価のスケールアップに大きく貢献します。

画像で物体を判別し、LiDARで位置を把握するという、それぞれの長所を組み合わせた手法です。1回の土石流イベントの挙動を1000の物体追跡で明らかにできるようになれば、観測に基づいた新たな理論が生まれるかもしれません。検知とは異なりますが、メカニズムの解明といった方向の研究も大事でしょう。今後が楽しみです。

文献:Deep learning-based debris flow hazard detection and recognition system

Deep learning-based debris flow hazard detection and recognition system: a case study | Scientific Reports

AI要約

背景
土石流は、突発的かつ急速に発生し、甚大な破壊力を持つため、山間部の住民やインフラにとって大きな脅威です。現在、多くの監視技術は雨量、地鳴り、土壌水分量などの自然指標に基づいていますが、センサーの設置や維持管理に多大なコストがかかるという課題があります。一方で、監視カメラは広く普及しているものの、これまでは主に事後確認用の受動的なツールとして利用されており、リアルタイムの早期警戒には活用されてきませんでした。
本研究は、ディープラーニングを用いてビデオ映像から土石流を自動的に検知・認識する能動的なシステムを構築することを目的としています。

手法
本システムは、特徴抽出、検知、認識の3段階で構成されています。

機械学習モデル:
特徴抽出ネットワーク(H-C3D): ビデオ映像から時空間的な特徴を抽出する3D CNNモデルです。土石流災害検知ネットワーク: 5層の全結合層(MLP)で構成され、ビデオの「異常性」を判定します。
土石流災害認識ネットワーク(2D CNN): 検知結果を検証するための画像レベルのCNNです。

説明変数: 監視カメラから得られる16フレーム単位の連続ビデオクリップ、およびH-C3Dによって抽出された4,096次元の特徴ベクトルです。
目的変数: 0から1の範囲の異常スコア、および最終的な判定ラベル(土石流、正常、または誤報)です。

異常スコアの算出(シグモイド関数): 検知ネットワークの最終層にシグモイド活性化関数が用いられており、入力された特徴ベクトルを0から1の範囲の「異常スコア(δ)」に変換します。スコアが1に近いほど、土石流の発生傾向が高いことを示します。
算出された異常スコアに対し、経験的に設定された閾値(θ = 0.6)が適用されます。スコアが0.6を超えた場合(δ > 0.6)、システムは「異常(Abnormal)」と判断し、初期検知を行います。
2D CNNによる検証プロセス: 「異常」と検知されたセグメントは、次に土石流災害認識ネットワーク(2D CNN)0.5を超えれば最終的に「土石流(Debris flow)」、そうでなければ「誤報(False alarm)」と識別します。この流れにより、ノイズによる高い異常スコアを誤報として排除することが可能になります。

結果
独自データセット「Debrisflow23」を用いた評価の結果、以下の高い性能が示されました。
検知・認識精度: 検知精度は86.3% AUC、認識精度は83.7% AUCを達成し、システム全体の最終的な識別精度は88.1% AUCに達しました。
リアルタイム性能: 処理速度は68 FPSを記録しており、実用的な早期警戒システムとして十分な速度を備えていることが証明されました。

考察
ビデオレベルの動的な検知と、画像レベルの認識を組み合わせることで、単一のモデルよりも精度と堅牢性が向上することが確認されました。特に、第1段階の検知ネットワークで見落とし(偽陰性)を抑えつつ、第2段階の認識ネットワークで誤報(偽陽性)を削減する構造が有効に機能しています。

今後の課題
データ多様性の不足: 本システムの学習に使用されたデータセット(Debrisflow23)は、現時点では規模が比較的小さく、「あらゆる天候条件や環境、流れの挙動を網羅できているわけではない」。
精度の低下: 複雑で変動の激しい現場環境においては、システムの汎用性(汎化能力)が低下する可能性がある。実際に、特定の条件下では検知ネットワークが誤報を出したり、逆に発生を見逃したりする「失敗事例」も確認されています。

動画による検知は簡単で、このようなDNNなどの機械学習までは必要なく、画像処理でも対応可能です。実際、動画にラベリングをする際にリアルタイム処理の動態検知を使うこともあります。
画像処理技術だと昔から普及しているので、社会実装しようと思えば誰でも容易にできたのですが、欠点があります。夜間、霧など。閾値を昼間と変得ないといけなかったり、そもそも視認できなかったり。この欠点があるので実装されてこなかったのだろうと思われます。

近年、国内でもCCTVでなく簡易カメラを設置して対応する研究が見受けられますが、欠点は同じです。ま、簡易カメラなら流されても痛くはないので 多数つけられるという長所はありますが。

解決策は熱赤外カメラ。ただし現状は高価。安いものは距離、解像度が不足しています。もう少し待てば安価なカメラが出てくるでしょう。

文献:Characterizing and clustering debris flow and environmental noise seismic signals using unsupervised deep learning

Characterizing and clustering debris flow and environmental noise seismic signals using unsupervised deep learning | Geophysical Journal International | Oxford Academic

AI要約

1. 背景
土石流は山岳地帯において極めて破壊的な自然災害であり、その対策として微震モニタリングが有効なリアルタイム検知手法となっています。しかし、従来の技術では土石流、落石、地震、環境ノイズといった異なる発生源からの混合信号を識別することが困難であり、土石流イベントの完全な動的進化を理解する上での制約となっていました。また、既存の教師あり学習は大量のラベル付きデータを必要としますが、地震データの多くはラベルがなく、人的なラベル付けには誤りも伴うため、ラベルなしデータから信号の固有構造を自動的に識別できる教師なし学習手法の確立が求められていました。

2. 手法

スペクトログラムの作成:
信号選択: 信号対雑音比(SNR)が高い垂直成分を選択。
窓関数適用: 信号の連続性と完全性を確保するため、60秒の固定窓長を採用。
基本的処理: instrument response(計器特性)の除去、デトレンド、デミーンを実施。
フィルタリング: 5Hz以上の高周波エネルギーを強調するため、4次バターワースハイパスフィルタを適用。
時間・周波数変換: 短時間フーリエ変換(STFT)を実施し、ハニング窓と50%のオーバーラップを設定。
正規化: 最大エネルギーで全特徴量を正規化。

データの分割方法とデータ数:
総データ数: 42,057個のスペクトログラムを使用。
分割方法: ACEの学習において、70%を訓練データ、30%を検証データとして非復元ランダムサンプリングにより分割しました(ホールドアウト検証)。過学習対策として、検証損失が30エポック連続で減少しない場合に停止する「早期停止(Early Stopping)」を採用しています。
ラベル付きデータの割合: 本研究は基本的に教師なし学習ですが、最適なクラスター数(K)の決定などの評価のために、合計データのうち2,000個(約4.7%)のランダムに選択され手動でラベル付けされたサンプルが使用されました。

機械学習手法:
モデルの流れ: 生の地震動信号 → 前処理 → 2Dスペクトログラム生成 → ACEエンコーダによる16次元潜在特徴量への圧縮 → GMM/DECによるクラスタリング(K=24)→ クラスター内頻出ラベルによるクラス分類。

特徴量抽出(深層オートエンコーダ: ACE): 2次元スペクトログラムを入力とし、4層の畳み込み層を持つエンコーダを用いて、高次元データ(38,400次元)を16次元の「潜在空間(Latent Space)」に圧縮し、コンパクトな特徴表現を獲得します。

クラスタリングとクラス分類の詳細: 抽出された潜在特徴量に対し、Deep Embedded Clustering (DEC) 、 ガウス混合モデル (GMM) を適用して自動分類を行います。最適なクラスター数は、外部評価指標(ARI、NMI、Purity)に基づき、複雑な信号構造を捉えるのに最適な K=24 と決定されました。最終的なクラス分類(ラベル付け)は、名前のない各クラスター内を確認し、「そのクラスター内で最も頻繁に出現する既知のラベル」をそのクラスターの代表ラベルとして定義することで行われます。

目的変数(分類対象): 土石流、落石、地震、環境ノイズの4カテゴリです。

3. 結果
分類精度とF1スコア:GMMの全体精度は92.32%に対し、DECは複雑な土石流信号の識別に優れ、全体精度93.21%を達成しました。各手法のカテゴリ別F1スコアは以下の通りです。

土石流: GMM 0.891 / DEC 0.9392
環境ノイズ: GMM 0.9134 / DEC 0.9233
地震: GMM 0.9758 / DEC 0.9759
落石: GMM 0.9184 / DEC 0.8661

精度向上:
同じガウス混合モデル(GMM)を用いて以下の2パターンで実験を行いました。

全データ一括処理: 42,057個のデータを一度にクラスタリングした場合、精度は92.32%でした。
サブセット分割処理: データを5つのサブセットに分割してそれぞれクラスタリングを行った結果、平均精度は96.81%にまで向上しました。

複雑なパターンの認識: データセットが巨大すぎると、AIはその中に隠れている非常に複雑なパターンを見落としてしまうことがあります。データを小さく分割することで、AIは各サブセット特有の細かい特徴に集中できるようになります。
データ間の密接な関係性の把握: 分割された後のデータ群では、個々のデータポイント同士の結びつきがより強まり、AIがデータの「潜在的な構造( underlying structure)」をより効果的に特定できるようになります。
計算の効率化と負荷軽減: 大規模なデータを一度に計算するよりも、分割して処理するほうが計算上の複雑さが抑えられ、結果としてより洗練されたクラスタリング結果を得ることが可能になります。

潜在特徴量の物理的な意味: 抽出された16個の潜在特徴量は、従来の地震学的属性との相関分析により、以下の物理的意味を持つことが確認されました。
時間領域の反復性: 自己相関関数のピーク数(信号の周期性や規則性)と最も強い相関があります。
周波数領域の特性: 中心周波数の第1四分位数、正規化DFTの分散および中央値(エネルギーの分布特性)と強い正の相関を示します。
これらは、土石流の各段階で変化する物理特性を効果的に捉えています。

4. 考察
土石流の「発生・輸送・堆積」の違い: クラスタリングにより、単一の土石流イベントを物理的な段階に対応する3〜4つのクラスターに自動分割することに成功しました。
発生(初期・メインサージ): 振幅が劇的に増大し、パワースペクトル密度(PSD)が最大になりますが、大量の物質の摺動により中心周波数は比較的低くなります。また、強い攪乱により楕円率と入射角が大きくなります。
輸送(通過): サージ(段波)の影響により、10〜50Hzの範囲で周波数とエネルギーが進化します。
堆積(終息): 流速と粒子サイズの減少により、エネルギーは低く、中心周波数は高くなる傾向があります。波の運動はより規則的で垂直志向になります。

教師なし学習の有効性: 大規模なラベルなしリアルタイムデータの処理に適しており、高密度観測ネットワークでのパターン発見において教師あり学習よりも汎用性が高いことが示されました。

早期警戒への応用: 潜在特徴量を教師あり学習(ランダムフォレスト)の入力に用いることで、93.15%の精度でリアルタイム早期警戒が可能になる展望が示されました。


1分データでも、ラベリングの手間はかなり大きくなります。それを回避すべく教師なし手法を利用する、という方針です。ただし、評価が必要なのでいくらかはラベリングされています。ある程度のドメインシフトにも対応できそうな手法に思えます。

24クラスタ → 4クラスなので、土石流の「発生・輸送・堆積」などへ自動的に対応できるところも当手法の特徴です。これは教師あり学習でラベルの境界を決定するのが難しいところですので、人為的ミスを回避する点でも魅力的です。

サブクラスタに分けておき、それぞれの結果を Voting するようにしてもリアルタイム運用は可能でしょう。


2026年3月8日日曜日

文献:Adaptive Machine Learning Framework for Debris Flow Monitoring

Adaptive Machine Learning Framework for Debris Flow Monitoring in Nonstationary Environments in Illgraben, Switzerland by Jui-Ming Chang, Qi Zhou, Hui Tang, Jens M. Turowski, Ko Ko :: SSRN

AI要約

1. 背景
土石流は山岳地帯における主要な災害であり、地震動データを用いた機械学習モデルによる検知が有効です。しかし、地球物理データの性質が時間とともに変化する「コンセプトドリフト」という現象が、モデルの長期的かつ汎用的な運用において大きな課題となります。
本研究は、このデータ分布の変化(非定常性)に直接対応し、高い検知精度を維持できる適応型機械学習フレームワークを開発することを目的としています。

2. 手法
機械学習手法
複数のモデルを組み合わせた Stacked Heterogeneous Ensemble を採用しています。

ベース学習器
LSTM+MLP: 10分間のシーケンスを処理するLSTMと、最新の値を処理するMLPを統合したハイブリッド構造で、時間依存性と瞬時の特徴を捉えます。
XGBoost (XGB): 静的な勾配ブースティングモデル。
ランダムフォレスト (RF): 静的な決定木アンサンブルモデル。

メタ学習器
ロジスティック回帰: 各ベースモデルの出力を統合し、単一の堅牢な確率スコアを算出します。

ハイパーパラメータ最適化
Optunaフレームワークを使用し、40回の試行を経て各ベースモデルを最適化しました。

変数
目的変数: 1分間の観測ウィンドウにおける「土石流(debris flow)」または「土石流なし(no debris flow)」のバイナリラベル。
説明変数: 当初は5つのドメイン(ベンフォードの法則、波形、スペクトル、スペクトログラム、ネットワーク特性)からなる80個の特徴量を使用していました。これに時間力学やエネルギー分布を捉える22個の新しい変数を加え、合計92個の特徴量を候補としています。

インバランスデータ
土石流イベントは極めて稀であり、データセットには深刻なクラス不均衡(クラスインバランス)が存在します。
不均衡比: 2017-2018年で0.0023、2019年で0.0078、2020年で0.0094と非常に低くなっています。

データ分割(図1bフローチャートに基づく)
各年6月から8月までの厳密な時系列データを使用しています。
学習(Training): 2017年から2018年のデータを使用。モデルの初期構築に用いられます。
検証(Validation): 2019年のデータを使用。これをさらに80/20に分割し、80%をメタ学習器の訓練に、残り20%を微調整(Tuning)用に保持します。
テスト(Testing): 2020年のデータ(Hold-out test year)を使用。最終的な汎用性を評価します。
データ数: 2020年のテストデータでは、ステーションごとに約13万サンプル(1分単位)が含まれています(例: ILL18でTN=131,371)。

適応機構とドリフト検知
ドリフト検知: 2019年の検証期間と2020年のテスト期間の間の分布変化を、2標本コルモゴロフ–スミルノフ検定(KS検定)を用いて判定します。
有意水準: p < 0.05 で有意なドリフトを検知します。
対応動作: 有意なドリフトが検知された場合、事前に保持していた2019年のデータ(20%分)を用いて、事前に訓練されたLSTM+MLPモデルを**微調整(fine-tuning)**し、新しいデータ分布に適応させます。

3. 結果
全体性能: 3つのモニタリングステーションにおいて、F1スコア0.873から0.927という高い精度を達成しました。

ステーション別の特性: 最上流のILL18で最高のF1スコア(0.927)を記録した一方、下流のステーションでは環境ノイズの影響により、7月に精度が低下する傾向が見られました。

特徴量の寄与: 全92個の特徴量から、ドリフトに強い上位25個を選択して学習に用いる「ドリフト対応特徴量選択」が、モデルの汎用性向上に最も寄与することが明らかになりました。

4. 考察
適応戦略の重要性: 単一のグローバルモデルでは時間的・場所的な変化に対応できず、ステーション固有かつ適応型のシステムが必要不可欠です。
時間的モデルの役割: LSTM+MLPのような時間的依存性を学習するモデルは、見逃し(False Negative)を減らす上で不可欠な要素であることが確認されました。

今後の課題: モデルの長期的な安定性を確保するためには、最新データを用いた定期的またはスライディングウィンドウ方式による再学習プロトコルの確立が重要です。

特徴量のリンクは張られていませんが、以下がベースになっています。
agupubs.onlinelibrary.wiley.com/action/downloadSupplement?doi=10.1029%2F2024JF008094&file=2024JF008094-sup-0001-Supporting+Information+SI-S01.pdf

ドリフト(ドメインシフト)への対処療法が書かれた文献です。

  • シグナルの「時間的進化」を捉えることが精度維持の鍵。
  • 統計的な変化(ドリフト)を検知した場合のみ、直近のデータを用いて時系列モデルを再訓練する。
  • ドリフトを考慮した特徴量選択が必要。

同じ渓流でも上流と下流、経過時間によって振動は変化し、最適な特徴量は異なる。変化を考慮したモデルが必要、という考えに沿ってモデルが作成されています。ドリフトの有無の判断にKS検定を用いており、その結果を特徴量重要度にも反映しています。
既存の手法を組み合わせて対応するといった、実務向きな内容だと思います。

2026年2月28日土曜日

文献:Spatial variations in groundwater chemistry in Uganda

Spatial variations in groundwater chemistry in Uganda: Geogenic origins and geochemical controls across diverse hydrogeological settings - ScienceDirect

AI要約

ウガンダの人口の約75%は地下水に依存しており、特に農村部や都市周辺部においてその重要性は極めて高い。本調査では、5つの主要な水理地質学的環境(先カンブリア紀変成堆積岩、片麻岩複合体、未固結堆積物、火山岩、変成火山岩)を対象に分析が行われた。

  • 主要な水質特性: 地下水の多くは、地質との平衡状態を反映した新鮮な「Ca-HCO3(炭酸水素カルシウム)型」であるが、変成火山岩(MV)や堆積物(SDM)の設定では、陽イオン交換や地球化学的進化の進行を反映した「Na-HCO3(炭酸水素ナトリウム)型」や「Na-Cl(塩化ナトリウム)型」が支配的である。
  • 水質基準の超過状況: 世界保健機関(WHO)の飲料水指針値を超える項目として、硝酸態窒素(NO3⁻)が全サンプルの14%で検出された。その他、マンガン(Mn)5%、鉄(Fe)3%、フッ化物(F⁻)3%、塩化物(Cl⁻)3%の割合で超過が見られた。
  • 地球化学的制御要因: ケイ酸塩(主にフェルシック岩)の風化、陽イオン交換、および炭酸塩の溶解が主要な支配要因である。一方で、蒸発濃縮や石膏の溶解による影響は最小限であることが示された。
  • 二次鉱物の安定性: 火山岩地域では、急速な流動と排水条件により「カオリナイト」が安定する一方、その他の地域では「クリノプチロライト」が安定する傾向にある。

1. 水理地質学的環境の概要

調査対象となったウガンダの地質は多岐にわたり、30億年以上の歴史を持つ先カンブリア紀の結晶質の基盤岩が大部分を占める。本報告書では、以下の5つの区分に基づき分析を行っている。

略称
水理地質学的区分
サンプル数 (n)
主な特徴
MS
先カンブリア紀変成堆積岩
30
ビクトリア湖テレーンの花崗岩・緑色岩など。
GG
顆粒岩・片麻岩複合体
21
ウガンダ東部(イガンガ、カリロ、トロロ)に広く分布。
SDM
未固結堆積物
10
キョーガ湖盆地周辺。高い浸透性を持つ。
VO
火山岩
7
エルゴン山周辺。アルカリ性/ソーダ性火山岩。
MV
変成火山岩
6
ブシア周辺の変成した火山岩。


2. 地下水の化学特性と空間的変動
地下水の化学組成は、水理地質学的環境によって顕著な差異を示す。

2.1 主要イオン
地下水の多くは、化学的進化が限定的な浅層地下水に典型的なCa-HCO3型に分類される。しかし、特定の地質条件下では異なる特性が見られる。

  • SDM(堆積物): 陽イオン(Ca, K, Mg, Na)および陰イオン(Cl⁻, SO₄²⁻, F⁻, HCO₃⁻)の濃度が最も高い。これは、未固結堆積物の高い空隙率と透過性が鉱物溶解を促進しているためと考えられる。
  • VO(火山岩): 主要イオンの濃度が最も低い。サンプリングされた湧水は流速が速く、岩石との接触時間が短いため、岩石・水相互作用が限定的であることを示唆している。
  • MV(変成火山岩): Na-HCO3型が支配的であり、帯水層の脱塩過程における陽イオン交換の影響が強い。
  • SDMの一部: Na-Cl型が優勢であり、蒸発濃縮、粘土質堆積物内の陽イオン交換、または人類起源の入力の影響が示唆される。

2.2 溶存ケイ素 (Si)
Si濃度は、SDM > MV > GG > MS > VO の順で低下する。これはケイ酸塩の風化率の差、または各環境におけるフェルシック岩の分布と風化の程度を反映している。

3. 地球化学的プロセスと支配要因
分析結果から、地下水質を形成する主なメカニズムが特定された。

3.1 鉱物の風化と溶解

  • ケイ酸塩風化: 全ての環境において、(Na⁺+K⁺)/Cl⁻比が1を超えており、ケイ酸塩(長石類)の風化が主要なイオン源であることを示している。
  • 炭酸塩溶解: カルサイトやドロマイトの溶解が、特に火山岩地域などでCaやMgの供給源となっている。
  • 限定的な影響: ギブス図(Gibbs diagram)によれば、岩石の風化が支配的であり、蒸発や降水による影響は小さい。また、石膏の溶解による影響も極めて限定的である。

3.2 陽イオン交換プロセス
(Na⁺+K⁺)-Cl⁻ と (Ca²⁺+Mg²⁺)-(HCO₃⁻+SO₄²⁻) の関係から、陽イオン交換が地下水組成の変化に重要な役割を果たしていることが判明した。特にMVやSDMでは、Ca²⁺やMg²⁺が鉱物表面のNa⁺と交換されるプロセスが顕著である。

3.3 二次鉱物の熱力学的平衡

  • Geochemist's Workbench® (GWB) 2023 Community Edition: Piper図やDurov図の作成、飽和指数(SI)安定図の作成に使用されました。この計算には、thermo.tdat データベースが利用された。
  • PHREEQC : Ca、K、Si、Na、pH、温度などの入力パラメータを用いて、全サンプルのイオン活動度を計算するために使用されました。こちらには、Phreeqc.dat データベースが利用された。

地球化学モデリングにより、以下の平衡状態が確認された。

  • 不飽和状態: ほとんどのサンプルでカルサイト、ドロマイト、石膏、ハロゲン化物は不飽和であり、これらが溶解する余地があることを示している。
  • 過飽和状態: 石英(Quartz)については一貫して過飽和状態にある。
  • 安定相の相違: 火山岩(VO)地域では「カオリナイト」が安定な二次鉱物として形成される(モノシアリタイゼーション)。これは急速な地下水流動と低いケイ素蓄積を反映している。一方、他の環境では「クリノプチロライト(沸石の一種)」が安定相となりやすい。
  • 溶解度の差: 石英は非常に安定した結晶構造を持っており、溶解度が非常に低い。一方、非晶質シリカは構造が不規則で、石英よりもはるかに水に溶けやすい(溶解度が高い)。
  • シリカ濃度の供給源: この地域の地下水中のシリカは、主に長石(アルバイト、カリ長石、灰長石)などのケイ酸塩鉱物の風化(加水分解)によって供給されています。
  • 飽和状態の閾値: 地下水に溶け出したシリカ(H4SiO4 )の濃度は、石英の低い溶解度を上回るには十分な量であるため、石英に対しては「過飽和(SI > 0)」となります。しかし、その濃度は非晶質シリカの高い溶解度に達するほどではないため、非晶質シリカに対しては「不飽和(SI < 0)」の状態にとどまっています。
  • 沈殿の速度(キネティクス): 石英は熱力学的に過飽和であっても、実際に沈殿して結晶化する速度が非常に遅いという特徴があります。そのため、地下水中のシリカ濃度は、石英の飽和線を超えて、非晶質シリカの飽和線に近いレベル(または二次鉱物を形成するレベル)まで上昇して維持されます。
  • このように、地下水の化学組成は、最も溶けにくい相(石英)と最も溶けやすい相(非晶質シリカ)の中間に位置しており、これが二次鉱物(クリノプチロライトやカオリナイトなど)の形成に影響を与えています。
3.4 考察 
  • ウガンダの火山岩地域(VO)では、湧水などの迅速な地下水の流れがあり、非常に良好排水(well-drained)されています。このため、長石などの一次鉱物が風化してシリカが放出されても、それが蓄積せずに洗い流されるため、溶解シリカ濃度が他の地域ほど高くならず、カオリナイトが熱力学的に安定な相となります。
  • このような迅速な水の循環と低いシリカ蓄積条件下では、ケイ酸塩鉱物の風化プロセスとしてmonosiallitisation が活発になります。これは、シリカが豊富な二次鉱物(クリノプチロライトなどのゼオライト)が形成される代わりに、よりシリカの含有率が低いカオリナイトが形成されるプロセスです。
  • 石英は非常に溶解度が低いため、カオリナイトが安定するような比較的低いシリカ濃度であっても、石英の飽和指数(SI)は0を超え、過飽和状態になります。つまり、「石英にとっては十分な濃度だが、ゼオライト(クリノプチロライト)などのよりシリカを必要とする鉱物が形成されるには不十分な濃度」という絶妙なバランスにあるときに、カオリナイトが安定します。 
  • ウガンダの火山岩地域(VO)の地下水は、調査された設定の中で最も高いpH値(最大8.4)を示しており、この化学的条件がカオリナイトの安定領域に位置する要因の1つとなっています
  • 対照的に、MS(変成堆積岩)やGG(片麻岩)などの他の地質環境では、水の滞留時間が長くシリカが蓄積しやすいため、よりシリカ濃度の高い環境で安定するクリノプチロライトが優勢になります。
  • クリノプチロライトは、たとえ地層中での含有量が少なくても、活発なイオン交換を促進することで地下水の化学的性質に直接的な影響を及ぼすことができます。
  • 陽イオンの組成変化: 特にメタ火山岩(MV)地域などで顕著ですが、地下水中のカルシウム(Ca2+)やマグネシウム(Mg2+)が、鉱物表面のナトリウム(Na+)と優先的に交換されるプロセス(陽イオン交換)を支えています。
  • このイオン交換の結果、地下水のタイプが一般的なCa-HCO3型から、より化学的に進化したNa-HCO3型やNa-Cl型へとシフトします。
  • フッ化物濃度の制御: ナトリウムに富む水(Na-rich waters)へと変化することで、ベース交換プロセスを通じてカルシウム濃度が低下し、その結果として蛍石(Fluorite)などからのフッ化物の放出・溶解を助長する傾向があります。 
  • SDM(未固結堆積岩)地域においてNa-Cl型(塩化ナトリウム型)の地下水が支配的(サンプルの40%)になる背景には、地質学的・水文学的な複数の要因が組み合わさっています。
  • 蒸発濃縮プロセスの影響: SDM地域の地下水は比較的浅く、水理的に活動的な層に存在します。このような環境では、地下水面に近い場所での蒸発濃縮が、地下水の塩分濃度(Na⁺およびCl⁻)を高める強力な制御要因として働いています。
  • 局所的な残留塩分: この地域の地質は細粒の湖成堆積物を含んでおり、そこに閉じ込められた局所的な残留塩分(residual salinity)が地下水に影響を与えている可能性が指摘されています。
  • 粘土質堆積物での陽イオン交換: SDM地域に含まれる粘土が豊富な堆積物において、陽イオン交換が進むことでナトリウムが濃縮されやすい環境にあります。
  • 高い空隙率と浸透性: ウガンダの未固結堆積物は高い空隙率と浸透性を持っており、これが迅速な水の移動を可能にしています。通常、流れが速いと反応時間は短くなりますが、常に未飽和の新しい水が鉱物表面に供給され続けることで、化学的勾配が維持され、活発な鉱物溶解が継続します。
  • 人為的要因: 農業や都市化に伴う人為的な入力(下水など)も、Na⁺とCl⁻の両方を供給する要因として寄与していると考えられています。

 4. 水質評価と利用可能性

4.1 飲料水としての適合性
全体として多くの地点でWHOの指針値を満たしているが、一部で超過が確認された。

項目
全体超過率
環境別の主な超過状況
起源の推定
硝酸態窒素 (NO3⁻)
14%
MS (20%), GG (14%)
農地排水、都市汚染、不適切な衛生施設(人為的)
マンガン (Mn)
5%
MS (13%)
母岩の自然風化(地質的)
鉄 (Fe)
3%
MV (17%), GG (5%)
母岩の風化、パイプの腐食(地質的/設備的)
フッ化物 (F⁻)
3%
SDM (10%)
フッ石や雲母などの鉱物溶解(地質的)

4.2 灌漑への適合性
ほとんどのサンプルは「低〜中程度の塩分濃度」および「低ナトリウムリスク(C1-S1 〜 C3-S1)」に分類され、多くの作物に適している。ただし、一部のボーリング孔(SDM, MS, GG)ではマグネシウム・ハザード比が1を超えており、長期的な使用により土壌の浸透性を低下させるリスクがある。

5. 結論
本研究は、ウガンダの多様な地質が地下水のベースライン水質を決定する主要な要因であることを明らかにした。

  • 地質学的支配: 地下水の化学組成は、主にフェルシックなケイ酸塩鉱物の風化、炭酸塩の溶解、および陽イオン交換によって形成されている。
  • 空間的変動: 堆積物地域(SDM)では溶存イオン濃度が高く、火山岩地域(VO)では低い。
  • 人為的影響: 硝酸態窒素の超過は人為的な汚染(農業や都市廃棄物)を示唆しており、特に人口密度の高い地域での監視が必要である。
  • 管理への示唆: 水理地質学的環境ごとに異なる水質特性とリスクが存在するため、地域特性に応じた地下水管理とモニタリング戦略の構築が求められる。


カオリンや沸石の熱力学的安定領域、イオン交換に伴う水質の変化などが記されています。試験結果を使って、分析を行い、評価するといった道理にかなった手順が踏まれていて、理解しやすい内容だと思います。