2020年6月24日水曜日

統計モデリング

先日、以下の図書をベースにした統計モデリングにかかわる話を聞きました。
樋口「予測に生かす統計モデリングの基本」

以前読んだ「地下水モデル」にデータ同化が記載されており、どのようなものかを知りたいと購入していた図書でした。が、意味が分からず寝かせていました。
その後、逆解析に粒子フィルタを利用された方の話を聞いたこともあり、この機会に引っ張り出して読み直しました。

ま、結局、最後まで読んでも具体的にどのように役立つのか、どのようにシミュレーションに組み込めば良いかは、相変わらず理解できませんでした。
基本コードが手元にあるので、いずれ迫られたら読んでみましょう。

以下、備忘録です。6章まで。

*********************************
加法定理の一般化、同時確率から確率変数を1つ取り除く作業が周辺化
→周辺確率を求める作業
P(A1)が周辺確率。
P(A|B)が「Bが所与のもとでのAの」条件付確率

周辺化
P(A)=∑B P(A,B)
書き下すと(加法定理)
P(A1)=P(A1,B1)+P(A1,B0)
P(A0)=P(A0,B1)+P(A0,B0)
全体:100、A1:30、B1:60、A1∩B1:10の時、
P(A1)=10/100+20/100=30/100

乗法定理
P(A,B)=P(A|B)p(B)=P(B|A)p(A)
書き下すと
P(A1,B1)=P(A1|B1)p(B1)=P(B1,A1)P(A1)
10/100=10/60*60/100=10/30*30/100

ベイズの定理(乗法定理を周辺確率で割る)
P(A|B)=p(B|A)p(A)/P(B)
=p(B|A)p(A)/∑A P(B,A)∵周辺化
=p(B|A)p(A)/∑A(P(B|A)p(A))∵乗法定理

*********************************
状態空間モデル:システムモデルと観測モデルの連立
線形:ガウス状態空間モデル
システムモデル(計算更新時のシステム誤差 vt を含む)
xt=Ftxt-1+Gtvt  vt~N(0,Qt)
観測モデル(観測誤差wtを含む)
yt=Htxt+wt  wt~N(0,Rt)

非線形:非線形・非ガウス状態空間モデル(データ同化で利用)
xt=ft(xt-1,vt)  vt~p(v|θsys)
yt=ht(xt,wt)  wt~p(w|θobs)
θは未知→最尤法で推定

マルコフ性1:xt~p(xt|xt-1)
マルコフ性2:yt~p(yt|xt)

*********************************
予測分布:p(xt|y1:t-1)
フィルタ分布:p(xt|y1:t) 
平滑化分布:p(xt|y1:T)

情報処理での「フィルタ」は信号処理のフィルタとは別
情報処理での「平滑化」はデータ解析の平滑化とは別。回顧による知識発見が目的。工学系の応用問題は、リアルタイムに適切な処理を施すことが重要で、平滑化分布から得る意味があまりない。

固定ラグ平滑化
固定点平滑化:データ取得毎に初期分布の改善(データ同化で利用)

※固定点平滑化は地下水シミュよりも、力学シミュで役立ちそうです。が、具体的な処理方法が思い浮かぶまで理解できていません。うーん。

0 件のコメント:

コメントを投稿