データ分析関連のまとめ

データ分析・機械学習周りのもくもく会LTやイベント参加をまとめていきます

Inverse probability weighting(IPW:逆確率重みづけ)が適用される場面

IPWが適用されるようなバイアスのかかる場面について、まとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。

概要

  • 統計分析では基本的に全ての結果を等しく扱うが、いくつかの状況ではそれぞれの結果に対して異なるweight(重み)をかけることが適切である場合がある。
    • 良く知られている例として、Inverse probability weighting(IPW:逆確率重みづけ)がある。
    • 均質でないサンプルの取り方をした等により、バイアスがかかっている場合に使われる。
  • バイアスのかかる例
    • 医療に関係するものとして以下の例があげられている
      • アンバランスなサンプリングにより"selection bias"がかかる場合
      • 情報に欠損が発生してしまう場合

バイアスのかかる場面

アンバランスなサンプリング

  • 以下の例には、"selection bias"がかかっており、このバイアスは加重をかけた評価により除去できる可能性がある。
    • 重みをかけてオーバーサンプリングされたサンプルの影響を小さくしているイメージ

Surveys with unequal probabilities of selection

  • 高血圧に関する調査
    • あるグループにおいて、比較的珍しい特徴を持っている対象(65歳以上等)が過剰にサンプリングされている。

Two-phase prevalence studies

  • メンタルヘルス調査
    • 1phase目:サンプルされた患者がスクリーニング用のアンケートを完了
    • 2phase目:スクリーンでpositiveだった患者がオーバーサンプリングされてsubsampleが最終的な診断に選ばれる→診断方法の評価対象となる

情報の欠損がある

  • 以下のような場合には、結果の欠損がランダムに起きてしまい評価にバイアスがかかってしまう。
  • 欠損がある場合にも、ロジスティック回帰等を用いる事でIPWを使う事が出来る場合がある。

Studies with missing outcome data

  • 肥満における高血圧の影響についてコホート研究を行う。
    • コホート研究: 現時点(または過去のある時点)で、研究対象とする病気にかかっていない人を大勢集め、将来にわたって長期間観察し追跡する。
    • 一部の対象者は移住等によってデータが消えたり、競合リスク(他の原因によって亡くなる)があり、subgroupに問わず発生する。

Randomised trials with crossing over from one arm to the other

  • 病気に対して2種類の薬の効果を見る
    • 最初Aの薬を使っているが、途中でBの薬に変える患者がいる場合がある。

Inverse probability weighting(IPW:逆確率重みづけ)のざっくりとした概要

因果推論において興味のある処置に関するIPW

  • 傾向スコア(PS:Propensity score)を利用する。
    • 処置あり群:1/PSを重みとする
    • 処置なし群:1/(1-PS)重みとする
  • 仮定
    • 全ての処置は測定される
    • 処置に関するモデルが適切にモデリングされている

参考文献

  • Mohammad Ali Mansournia, Douglas G Altman / Inverse probability weighting

www.bmj.com

  • 安井翔太 / 効果検証入門 : 正しい比較のための因果推論/計量経済学の基礎

https://gihyo.jp/book/2020/978-4-297-11117-5