データ分析関連のまとめ

データ分析・機械学習周りのもくもく会LTやイベント参加をまとめていきます

CounterFactual Machine Learning勉強会 #2に参加しました

参加してからしばらくたってしまっていますが、「CounterFactual Machine Learning勉強会 #2」に参加したので、まとめました。

目次

  • なんの勉強会?
  • LT
    • CFML@KDD2019
    • オンラインデータからの処置効果の推論方法:最適腕識別と多重検定
    • CRM(Ad)における機械学習と因果推論という活用と展望
  • 参加した所感

なんの勉強会?

近年因果推論の知識を機械学習に応用したり、逆に因果推論の為に機械学習を応用するといった方法論が提案されています。 この勉強会はCounterfactual Machine Learningと呼ばれるこれらの手法に関する研究や実例の紹介を行う事を目的としたものです。

cfml.connpass.com

LT

CFML@KDD2019

藤田 光明さん

t.co

  • ビジネスの現場においてなぜCFMLが必要とされているかについて重点をおいた説明がされていた。
    事例
  • Booking.com:A/Bテストの実装コストがかかる問題に対して、Counterfactual(反実仮想)を考えること事前の検証で効果がよくないものを推計する。
  • Netflix:レコメンドにおけるUplift
  • Search engine:モデルのパフォーマンス改善
  • 事例から見てもCFMLと推薦システムとの親和性が高いのが印象的だった。

    オンラインデータからの処置効果の推論方法:最適腕識別と多重検定

    mkato_cseconさん

    www.slideshare.net

qiita.com

  • 多腕バンディット問題と処理効果の推定に関する代表的な手法についての紹介
  • 最適腕識別手法の一様選択に基づく方法(逐次削除方策):A/Bテストの一般化した形となる
  • スコアに基づく方法:confidence oundを用いた手法が現時点での最適な手法(但し扱いが難しい)
  • 実務等で扱うときには逐次削除方策で十分な事が多いとのこと

    CRM(Ad)における機械学習と因果推論という活用と展望

    清水 亮洋さん

  • 事業のKPIに対して機械学習と因果推論をどのように使うかについて話されていた
  • プッシュ通知やクーポン等の介入に利用:本当に介入が必要なひとを発見する
  • uplift modelingの利点:RCTを比較的行いやすい、お手軽(必要な期待値は一般的な教師あり学習で取れる)
  • 欠点:binaryの問題を解くので、どこかで目的変数を区切る必要がある→ビジネスを考慮しながら定義する必要がある
  • 実務観点では、介入の変化に弱い、事前に配布したデータが必要といった事を踏まえ活用場面を考える必要がある

    参加した所感

    理論的な所から実務での具体例や考慮すべき事項など実務においてヒントとなりそうな要素を知ることが出来た。また出来れば参加したい。