反事実モデルの計算(SCMで定義された線形モデルについて)

SCMで定義された線形モデルにおける反事実モデルについて、主に実際の計算や定理の理解をまとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。 (前回は以下リンクにおいてバックドア基準やフロントドア基準についてまとめています)

反事実モデルを扱うモチベーション

ある行動をした結果、現実に起こる事がなくなった別の行動に伴う結果を推定したい
- e.g.
  - 2倍の時間勉強していたら、テストの点数はどうなっていただろうか？
  - 下道ではなく高速で行ってたら早く着いただろうか？
- 反事実モデルを用いる

以下のような補習を受けた時間が、自主学習にどのように影響したかを表すモデルを考える(参考文献1の問題)

これらの変数の関係が線形である事を仮定し、SCMで以下の式のように表せるとする。 (ここでのSCMはSynthetic Control Methodを示していると思われる)
- ここの仮定は結構強い

計算の流れは以下のようになる
- 仮説形成:実際の観測値を用いてUの値を決定。
- 行動:モデル(今回は(1)~(3))において、反事実を求めたい変数変数について方程式を適当な値に変更する。
- 予測:行動で作ったモデルを使って、反事実の結果Yを計算。

仮説
ある学生において、観測された値がX=0.5、H=1.0、Y=1.5だったとすると(人より少し補習を受けた結果、点数が高い)

(1),(2),(3)の方程式は以下のようになる。

行動
この学生がもしもう少し補習を受けていた(X=1)とした場合(反事実)、(1')(2')(3')の式は以下のようなモデルになる。

予測行動によって出来たモデルにおける点数 $Y_1$ を計算する。

以下の定理がある。
X→Yの総合効果の傾き:τとする

この時、どのZ=e(任意の実観測値)についても以下が成り立つ

自分なりに理解したイメージを図示すると以下のようになる。