2024年12月22日日曜日

DASのピッキング

Seismic arrival-time picking on distributed acoustic sensing data using semi-supervised learning | Nature Communications

DASのピッキングに関する文献です。
従来の STA/LTA 等ではうまくいかないDASのピッキングに機械学習を使ったという内容です。

この文献、査読結果が一緒に公開されています。オープンサイエンスもここまで来たのだなと感心しました(他の文献でも公開されていますので、私の気づきが遅かったのでしょう)。

その中の指摘で、近年の文献を見ながら感じていた部分が明示されていました。

I do understand that deep learning is currently a big hype and that it is tempfing, especially for young researchers, to become part of this. However, the days where the mere applicafion of some deep learning model was science, are over. With numerous easily usable programming tools, the training of a neural network (deep or not; this is just somewhat hollow semanfics) has become an easy task for undergraduate students. After all, it is what it is: fifting the coefficients of some funcfional form to a collecfion of data.
This said, it is not clear how exactly the authors go significantly beyond just training yet another deep neural network? What is the innovafion that goes beyond the obvious?

LSM作成でも、機械学習分野でSOTAを達成した手法の流用は見ていて面白いのですが、それまでですよね。できたLSMが実際にどの程度使えるのかがわかりませんので。GISを使って特徴量を作り、機械学習にかけるというのは、学生でもできます。今年のGCONでは高専生も頑張っています。
第3回高専GIRLS SDGs×Technology Contest(高専GCON2024)

ピッキングも同じなのでしょう。他にもいくつか機械学習を利用している文献を見かけます。が、機械学習を使えば精度が上がった、だけの時代はもう終わったと認識せざるを得ません。

2024年12月20日金曜日

土砂災害と地質のスケール

第43回地質調査総合センターシンポジウム「地質を用いた斜面災害リスク評価-高精度化に必須の地質情報整備-」で千木良先生の発表を拝聴しました。

  • 能登地震でのある崩壊の素因として、パミスを含んだ厚さ5㎝程度の層が挙げられる
  • しかし、産総研の地質図に描かれるスケールではない

これまで全国の災害データの地質的素因をシームレス地質図を利用して分析してきましたが、がけ崩れ、土石流には大きく影響しませんでした(地すべりには地質が効きます)。純粋な地質のみでなく、複雑性や断層からの距離等の特徴量も作成しましたが、機械学習モデルが重要とは判断しませんでした。これは、崩壊データではなく、災害データだから(人の活動が影響する)というのが主要因ですが、上記も大きく影響しています。地質は影響する。しかし、あなたの地質図の選択が悪い、という事実を突き付けられているのです。

1つの崩壊、すべり毎に素因を抽出し、それを地道に、年月をかけて積み重ねる。数が集まったら、そこから共通性や特異性を見出すのが研究の基本手順なのですが、近年の研究ではその過程をすっ飛ばし、結果を早急に示しがちに思えます。手元にある災害データ、広域で使える均質な地質図、それらから得られた結果はどれほどの信頼性があるのでしょうか。「ないものは仕方がない」ではなく、ないから作る、積み重ねるのが研究であり研究者でしょう。目に見える成果や時短に迫られる立場もわからないではないのですが。

Landslide Sasceptibility Map を広域で作るのが他国で流行っています。「ひとまずやってみた」レベルが多いのですが、手法は着実に進歩しています。それに投入する特徴量の質が上がれば、信頼性もぐっと上がるでしょう。将来の方のために地味な仕事も積み重ねていきましょう。


2024年12月19日木曜日

直線性

地震波の直線性、平面性、方位角、傾斜角について知ったのが今年に入ってから。
プロから文献を紹介していただき、いくつか事例も見ましたが、なかなか文献に紹介されているような特徴は見出せませんでした。

河川流量の推定に振動を利用されている例を見ますが、以下では直線性、方位角も示されていました。
Exploring the relationship between seismic noise signals and modeled river flow data: A case study from Sicily, Italy - ScienceDirect

These analyses show that the scattered azimuth and the low rectilinearity values, observed at the beginning and the end of Helios, coincide with periods of increased wind speed (Supplementary Figs. 5a and b), which can generate a seismic noise as a consequence of the impact of the wind on the trees or buildings. Indeed, the wind seismic noise is usually characterized by spherical waves showing a low value of rectilinearity (<0.5) and a lack of horizontal trend values (Zheng and Stewart, 1992; Panzera et al., 2016).

振動を理解するには環境計測、音波等も含め多面的に捉える必要があるというのはつくづく感じているのですが、なかなかこのような結論に結び付きません。まだまだわからないことばかりです。

 

2024年11月26日火曜日

3次元地質モデルと機械学習 その3

Progressive Geological Modeling and Uncertainty Analysis Using Machine Learning

2段階で機械学習による層序区分、岩石区分を推定し、分布確率を同時エントロピーとして表現されています。1段階目では XYZ 座標を入力として層所区分を予測、2段階目はそれらと物性値2種を入力として岩石区分を予測。手法的には半教師あり学習になりそうです。

1段階目をミスると2段階目も誤りになります。が、地質と岩級の両方を扱いたい、などという場合に使えそうな提案です。

機械学習による確率分布の算出には、これまでの文献のようにボクセル毎で正規化するのではなく、ロジット値を算出しておいて後からモデル全体で正規化すべきだと考えています。が、2段階の場合はこの文献の求め方のほうが好みです。

確率分布の表現も複数あるので、目的に応じて使い分けるのが良いのでしょう。


2024年11月25日月曜日

3次元地質モデルと機械学習 その2

A stacking methodology of machine learning for 3D geological modeling with geological-geophysical datasets, Laochang Sn camp, Gejiu (China) - ScienceDirect

一歩進んで、地質、磁気探査、重力探査結果を組み合わせた3D地質モデルです。

 The input data are coordinate (x, y, z), magnetic susceptibility and residual density

Joint inversion とは異なり、これも物理的関係は考慮されていません。機械学習としてブラックモデルが分布確率を提示します。データ駆動型の手軽さと解釈の難しさを併せ持っています。
手法としてはアンサンブル(スタッキング)で判別性能を高める工夫がなされています。

日本でブラックボックスモデルは受け入れられるでしょうか?
近年の文献では、データ駆動型の方が物理ベースのモデルに比べて性能の良くなる傾向が認められると言われています。が、地質モデル作成の場合はトレーニングに利用できるボーリング数が補間するボクセル数に比べ、圧倒的に少なくなります。その場合は物理ベースモデルを利用し、その結果を地質屋さんが解釈し分布を推定する方が性能が良くなるでしょう。
その「解釈」部分のロジックを、先の文献のように損失関数に組み込んだペナルティとして数式で表現すれば、機械学習でも良い地質モデルを作れるようになると思われます。プログラミングのように、自分が何を考えて推定したのかを整理、伝達することから始める必要があるということです。


2024年11月24日日曜日

3次元地質モデルと機械学習

地質の3次元可視化にも機械学習が使われつつあります。

良い点は、推定地質の分布確率を表示しやすいこと。いえ、統計処理した確率ではありません。モデルが考える確率ということで、その根拠は曖昧です。
これまでは indicator kriging のように地球統計学を利用していました。が、それより手軽に算出できること、機械学習ユーザーの方が圧倒的に多いことから、今後事例が増えると思われます。

まずは、コチラ。2024年です。半教師あり学習を利用しています。
従来と同じくソースは XYZ と地質情報のみですが、線形補間しているようなリサンプリング手法を用いて大きなエラーが生まれないように工夫されているようです。
GMD - GeoPDNN 1.0: a semi-supervised deep learning neural network using pseudo-labels for three-dimensional shallow strata modelling and uncertainty analysis in urban areas from borehole data

次は損失関数を工夫した例。これも2024年。
地層の逆転がない場合、古い地層は必ず新しい地層よりも下位に分布するという単純な法則に対し、違反した場合にペナルティとなるよう損失関数に組み込んでいます。これだけの工夫ですが、うまく予測してくれる場合があるようです。PINNs から着想を得られたのかもしれません。
Research on 3D Geological Modeling Method Based on Deep Neural Networks for Drilling Data

いずれもまだ「やってみた」レベルですが、そのうちより良い推定ができるようなモデルの構築方法へ議論が進むことでしょう。一方で、統計処理や機械学習ができるほどボーリングを掘るサイトは少ないので、身近な土木分野では大きくは変化しないかもしれません。大きなサイトでどうなるか、今後に着目しましょう。

2024年11月22日金曜日

AI-driven rapid landslides mapping

NHESSD - Brief Communication: AI-driven rapid landslides mapping following the 2024 Hualien City Earthquake in Taiwan

地震時崩壊個所を、2手法で迅速に特定したという報告です。
ソースと機械学習手法の組み合わせは以下の通り。

  • Sentinel-1 (SAR) - CNN
  • PlanetScope(可視画像)‐ ViT

 The ViT model was pre-trained and validated on a multi-source landslide segmentation dataset (Fang et al., 2024), the Globally Distributed Coseismic Landslide Dataset (GDCLD). 

データ入手に日数を要していますが、作業自体は 20分~2時間程度だそうです。 
ViTの事前学習に利用したデータは公開されており、またCNNコードも公開されています。残念ながら私の環境では素直に走らなかったので、どの程度の成果が得られるのかは確認できませんでした。

能登の地震災害では、2日後に地理院で航空写真が公開され、3日後に崩壊個所の判読結果が公開されています。提案手法の場合、精度を保てないと現行手法と勝負にならないのですが、SARでは天候に大きく影響されない点や、広域でも一人で対応できる点が魅力です。そのうち性能は向上するでしょうから、災害直後の道路ネットワークの寸断箇所(孤立集落)の確認や天然ダム形成の確認に使える日が来るかもしれません。

航測会社も頑張って開発されていると思われますので、この分野で良い勝負がなされるよう期待したいところです。