2025年4月14日月曜日

Python から Box にアクセス

BOX から柱状図とコア写真を集める際に、Python SDK を利用しました。https://ja.developer.box.com/guides/tooling/sdks/python/

新たなSDKが推奨されています。
https://ja.developer.box.com/guides/tooling/sdks/python-g

が、web上に情報の多い古い方を選択しました。それによると、大まかな流れは以下の通りでした。

・BOXでアプリ(JWT)を作成・・・管理者にアプリを承認してもらう
・アクセスに必要な情報一式を config.json として書き出し
・Python で json を読み取り、ログイン
・目的のフォルダIDにアクセス・・・管理者にアカウントを追加してもらう

アプリの内容を変更するたびに管理者承認が必要でした。
次にデータを収集する必要に迫られた場合、新しい SDK で試してみましょう。


コア写真から柱状図の生成(失敗)

 生成AIの使い方を理解したので、今度はコア写真(JPG)から柱状図(XML)の作成をテスト。

BLIP系の事前学習モデルにコア写真と柱状図を与えてチューニングした後、最後に丸っと柱状図を吐き出させる方針です。この「丸っと」は手抜きです。まず、現状でどこまでできそうかを見たかったわけです。が、失敗。まともな文章になりませんでした。

それでも、手を入れると可能だろうなという感触はつかめました。
ある程度フォーマットを与える、推論させる固定させておく、選択肢を与える、等々。
地質側の難しいところは深度区分。これは他のモデルを事前に咬ませる必要があるでしょう。
アーキテクチャとしての制約は長さ。XMLだと長いもので4万字程度ありました。これを丸っと再現するのは現段階では困難です。が、数年後なら可能になっているでしょうね。

急ぐ必要はありません。しばらく寝かせておきましょう。