データを眺めている段階で見つけやすいのが相関性。
AとBには相関性、線形性がある。というような内容は頻繁に出てきますし、お客様にも説明します。が、Aの増加がB向上の原因、というような因果関係としては話せません。にもかかわらず、そのように解釈される方は多々いらっしゃいます。
何か良い方法はないか?と探していたところ、因果推論という手法があることを知りました。Amazon で見てみると、多くの図書が販売されています。枯れた手法なのでしょう。冬休みに入る前に2冊購入し、休みの間読んでいました。
これがなかなか頭に入りません。いえ、もともと統計が好きでなかった私には向いていないのだと思います。が、交互に読めば(と言ってもまだ読み終わっていませんが)基本的な内容は理解できました。わからないところは LLM に投げる。これがなかったら途中で投げ出していたことでしょう。
まずは初歩的な用語を列挙。日本語の図書を読んでいますが、利用可能なツールは英語なので、併記しておきます。
因果推論:causal inference
処置:treatment
介入:intervention
処置群:treatment group / treated group
対照群:control group
エスティマンド:estimand
疑似相関:spurious correlation
交絡:confounding
選択バイアス:selection bias
因果ダイアグラム:causal diagram
有向非巡回グラフ:DAG (directed acyclic graph)
d分離:d-separation
チェーン:chain (X → M → Y)
フォーク:fork / common cause (X ← Z → Y)
コライダー:collider (X → C ← Y)
バックドア条件:backdoor criterion
フロントドア条件:frontdoor criterion
0 件のコメント:
コメントを投稿