2025年11月6日木曜日

薄片画像 + ViT

PoreViT: Automated pore typing in carbonate rocks using vision transformers and neighborhood features - ScienceDirect

AI要約 

背景

  • 炭酸塩岩の孔隙(ポア)をその生成過程や物理的特性に基づいて分類することは、炭酸塩岩の微細構造と物理特性の関係を理解する上で重要である。
  • 従来の孔隙分類は主に手作業で行われ、非効率で主観的、かつ大規模解析には不向きである。
  • 既存の自動化手法は、孔のサイズや形状といった単純な特徴に依存しており、遺伝的クラス(生成過程に基づく分類)を正確に識別できていない。
  • CNN(畳み込みニューラルネットワーク)は画像分類に強みがあるが、局所的特徴の抽出に優れる一方で、画像全体のグローバルな文脈情報を捉えるのが苦手であるため、複雑な孔隙タイプの分類には限界がある。
  • そこで、Vision Transformer(ViT)を用い、局所的特徴とグローバルな文脈情報を融合し、孔隙の近隣情報(隣接する孔の情報)も活用することで分類精度の向上を目指す。

手法

  • PoreViTモデルを提案。これはViTをベースにしたモデルで、薄片画像中のマクロ孔隙をLucia分類(interparticle, touching vug, separate vug)に分類する。
  • モデルの特徴は、ViTの特徴量にGlobal Token Addition(GTA)層を加え、CNNから抽出した空間的特徴と融合するFeature Fusionブロックを持つ点。
  • 入力データは、単一の孔だけでなく、その周囲の孔やテクスチャ情報を含む近隣情報を含めてモデルに与えることで、局所的な孔系のトポロジーを認識可能にしている。
  • データセットは25枚の高解像度薄片スキャンから4115のラベルを取得し、これを用いてモデルを訓練・評価。
  • 従来のCNNモデル(DenseNet121)と比較し、精度(precision)と再現率(recall)で約4%の絶対的改善を達成。

結果

  • テストセットでPoreViTは正確度93.6%、precision 0.92、recall 0.93、F1 0.92を達成。最良CNN(DenseNet121)に対し精度・再現率で絶対+4.0%、相対約+4.5%の改善を示した。
  • クラス別ではinterparticleが最良(Precision 0.95、Recall 0.93、F1 0.94)、誤分類は主にseparate vugで発生。
  • 高解像度薄片1枚(2650孔)での全面推論は約1.5分で完了し、精度93%、Precision 0.931、Recall 0.930、F1 0.927を達成、処理スループットは1枚約2.8分(前処理1.3分+推論/後処理1.5分)で、1日160–170枚のバッチ処理が可能。
  • 近隣情報の活用が分類精度向上に大きく寄与している。
  • ViTの自己注意機構により、画像全体の長距離依存関係を捉えられるため、CNNの局所的受容野の制約を克服できている。
  • これにより、複雑な炭酸塩岩の孔隙タイプ分類において、より正確でスケーラブルな自動化が可能となった。

考察

  • CNNは局所的特徴の抽出に優れるが、グローバルな文脈理解が不足し、複雑な孔隙分類には不十分であることが示された。
  • ViTは画像をパッチに分割し、それぞれをトークンとして扱い、自己注意機構で長距離の関係性を直接モデル化できるため、孔隙の空間的・構造的関係をより深く理解できる。
  • 近隣孔の情報を含めることで、単一孔の形状だけでなく、その周囲の孔との関係性も考慮した分類が可能となり、実際の地質学的解釈に近い分析が実現。
  • 本研究は、炭酸塩岩の微細孔隙構造の高スループットかつ定量的な解析を可能にし、石油工学や地質学における炭酸塩岩評価の効率化と精度向上に貢献する。
  • 限界として、入力画像の高解像度・セグメンテーション品質・注釈品質への依存、224×224・パッチ分割による連続関係の断片化、ViTのデータ要求性、学習分布外リソファシスへの一般化不確実性、クラス不均衡の影響などが指摘される。
  • 将来展望として、Choquette & Prayの高次遺伝的分類への拡張(クラス数増でデータ収集が課題)、3DマイクロCTへの適用による真の接続性評価、Swinなどの多尺度ViTや自己教師あり事前学習、ハイブリッド拡張、予測不確実性の定量化などが提案されている。

 薄片画像 と 機械学習は相性が良いでしょう。地質屋さんなら鉱物の同定に利用するといった発想に至るようですが、特許もあるようなので注意。

0 件のコメント:

コメントを投稿