データ分析関連のまとめ

データ分析・機械学習周りのもくもく会LTやイベント参加をまとめていきます

潜在反応モデル概要(RubinおよびPearl)と、仮定となるSUTVAについて

潜在反応モデル概要とSUTVAについてRubinとPearlでの違いを含めてまとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。

概要

  • 潜在反応モデルにおいて、Rubin流とPearl流の2つ大きいアプローチの仕方がある。
  • 両者の違いとして大きいものの一つに対象者(unit)の定義の違いがある。
    • この違いにより、前提とされている仮定が異なっている。
  • 仮定:SUTVA
    • 以下の2つにより構成されている。
      • No Interference between subjects assumption
      • No mutiple versions of treatment assumption
    • Rubinでは2つとも必要であり、PearlではNo Interference between subjects assumptionのみ必要。

潜在反応アプローチ

  • 潜在反応アプローチ:対象者に対してある治療を行った際の反応を、対象者の特徴と結び付けてランダムサンプリング等の統計的要素を付加して因果効果の定量的評価を試みるアプローチ。
  • 潜在反応モデル:潜在反応アプローチの中核になり、統計的因果モデルとして位置づけられている。

    流派

  • Rubin流

    • 欠損値データの解析法を基調
  • Pearl流

    • 構造方程式モデル、ベイジアンネットワークを基調
    • 構造的因果モデル(SCM)を用いる≠グラフィカルモデル

構造的因果モデル

  • 構造的因果モデル:因果関係は何らかの関数関係を通して、決定論的に記述できるという考えに基づいて構築された因果モデル
  • ある確率変数の集合 {\bf{V}} = { (V_1, ...,V_p  })の要素間の関係が以下の構造方程式モデル(SEM)で規定され、それぞれが自律的なデータ生成過程をなすとき、その式を構造的因果モデルという。
    • 自律的:個々の構造方程式が独立している(ある関数の関数系が変化しても、その影響で他の関数系が変化しない)
 V_j = g_j(pa(V_j), {\epsilon}_j) \ \ \ (j=1,2,...,p)
 pa(V_j) \subset \bf{V} :V_jの直接的な原因と解釈される変数集合
 {\epsilon}_j:pa(V_j)で直接表現するのが困難な錯乱項
  • Pearlでは、この構造的因果モデルを因果ダイアグラムにて定性的に表現する。
    • 上式の pa(V_j)から V_jに矢線を引く。

潜在反応モデル

  • わかりやすい例として医療における治療の効果を考えた場合、以下のようになる。
  • ある対象者が治療を受けた時および受けなかった時の潜在反応変数の差から対象者レベルの因果効果を見積もる。
    • ここで、対象者(unit)という言葉自体の定義が重要となる。

対象者

  • PearlとRubinで定義が異なる
    • Rubin:個々の対象者を直接的に特徴づける属性からなるものであり、対象者を取り巻く環境などの間接的な情報が含まれない
    • Pearl:直接的に特徴づける属性だけでなく、あらゆる情報が含まれる。
    • 対象者の定義が異なる事から、必要とする仮定も異なっている。
      • Rubin:SUTVAが必要
      • Pearl:SUTVAの全ては必要でない(一部必要)

SUTVA(stable unit treatment value assumption)

  • 以下の2つの仮定を置いている
    • No Interference between subjects assumption(もしくはNo Interference among units assumption)
      • 対象者の潜在的な反応は、他の対象者への処置に依らず同じである。
    • No mutiple versions of treatment assumption
      • 対象者の反応は、どのように処置を受けたかには依存しない。

No Interference between subjects assumption

  • 対象者の潜在的な反応は、他の対象者への処置に依存せず同じである。
    • 任意の処置の割り当てメカニズムの下でも潜在的な反応は同じ
  • この仮定が成り立つ例
    • ある個人が頭痛薬を飲んだ時の効果:他者が薬を飲んだかどうかには依存しない。
  • 成り立たない例
    • 失業者を対象とした訓練による就職への効果:他者も訓練を受けたかどうかによって対象者の就職への効果も変わる

No mutiple versions of treatment assumption

  • 対象者の反応は、どのように処置を受けたかには依存しない。
      • ある対象者に対して手術を行い、それが成功するかどうかを考える。
      • No mutiple versions of treatment assumptionでは病院の設備や医師の技術に依らず成功するかどうかは決まると仮定

RubinとPearlにおけるSUTVA

  • 主にNo mutiple versions of treatment assumptionが影響する。
    • Rubin流における対象者:対象者を取り巻く環境についての情報が含まれていないので、SUTVAを仮定しない場合は効果を規定する事が難しい。→仮定されている

    • Pearl流における対象者:取り巻く環境についての情報が含まれるので、No mutiple versions of treatment assumptionが必要ではない。

  • No Interference between subjects assumptionはRubin、Pearl両方で必要な仮定となる。

参考文献

  • 1.黒木学、小林史明 /構造的因果モデルについて

https://www.jstage.jst.go.jp/article/jjb/32/2/32_119/_pdf/-char/ja

  • 2.Leonardo Grilli Carla Rampichini / Introduction to causal inference via potential outcomes

https://www.bristol.ac.uk/media-library/sites/cmm/migrated/documents/ci-potential-outcomes.pdf

  • 3.Marcelo Coca Perraillon / Causal Inference

http://www.ucdenver.edu/academics/colleges/PublicHealth/resourcesfor/Faculty/perraillon/perraillonteaching/Documents/week%203%20causal.pdf

  • 4.小川和孝 / 朝食摂取習慣の教育達成への因果効果の検証

https://csrda.iss.u-tokyo.ac.jp/panel/dp/PanelDP_079Ogawa.pdf