データ分析関連のまとめ

データ分析・機械学習周りのもくもく会LTやイベント参加をまとめていきます

白金鉱業 Meetup Vol.12に参加しました

「白金鉱業 Meetup Vol.12」に参加したので、まとめました
(間違っている点があった場合、指摘いただければ助かります)

どんなイベント?

ブレインパッドのデータサイエンティスト/機械学習エンジニアが社外のデータ系の仕事をしている人と交流したい!と始まった勉強会兼交流会です。気持ち的には交流会がメインです。同業の方も超welcomeです! 月イチくらいで継続的にゆるく開催し、発表社は業界/ジャンルを問わず、毎回社内外から広く立候補形式で募集しています!

brainpad-meetup.connpass.com

Talk

グラフ構造データに対する畳み込みの定義について実データを使いながら噛み砕く

濱本 章弘さん(日本アイ・ビー・エム株式会社)

  • グラフ畳み込みニューラルネットワークを直観的に理解することについて
    • グラフについて
    • Convolutionについて
    • Graphと2D Convolutionの違い
      • Filterの形が一定でない
      • Filterの動かし方を定義できない
    • GCNには2種類
      • Spectral
      • Spatial
    • Application:化学分野で最近活発なイメージ
    • 言語間の相関等を利用したグラフについて実際に分析した結果(Shakespeare's Plays Network)
    • Networkrepository.comの紹介 networkrepository.com

因果推論の基礎とその罠

仁ノ平 将人さん(株式会社ブレインパッド)
資料

t.co

  • 因果推論の基礎について
    • そもそも因果推論って?
    • 因果推論~施策の本当の効果~
      • TVCMを見るとアプリのプレイ時間が短くなる?
        • 背景が異なるデータは単純に比較出来ない
    • 難しいポイント
      • 次元が大きいと類似度計算が難しい
      • ランダム化比較試験が難しい
      • そもそもテスト/コントロール群にしかないデータがある(バイアスがある)
    • 反実仮想
    • 傾向スコアの導入
      • 条件:強く無視できる割り当て
        • 共変量xが同じであれば、割り当てzと目的変数の同時分布は独立
          • 割り当てを確認する方法→便利な公式は存在せず、圧倒的なドメイン知識がいる
      • 条件を満たすと傾向スコアマッチングが出来るようになる
    • 傾向スコアモデリングと罠
      • 傾向スコアを推定するモデルの学習
        • c統計量で評価:たまに0.7以上という見解があるか本当なのか?
        • 傾向スコアの分布:ヒストグラムがtestとcotrolで左右対称かが大事になる
      • マッチング
        • Standard Differenceで評価:どの共変量を使う?モデル作成の際にimportanceが高い共変量に対してSDを見る
        • テストかコントロールのどちらかのデータが少ないと問題生じやすい
      • 結局ABテスト最強
        • 因果推論制約強い

企業価値とデータ分析「その分析いくら儲かるの?」に超本気で向き合う

野口 友熙さん(株式会社ブレインパッド)

  • 企業価値と分析」のお気持ちを感じてもらう
    • 企業価値とは?
      • 会社全体の経済的価値
      • 日々の全ての活動が企業価値の向上に寄与している(と信じている)
    • 分析が企業に与えるインパク
      • 分析の基本は比較
      • 企業価値向上に重要な指標たち
        • ROE
        • ROA
        • ROIC:本日の主役(他の指標に比べて企業価値との関連性が高いと言われる)
      • ROIC経営
        • オムロンROIC経営における特徴:ROIC翻訳式、ROIC逆ツリー展開
        • ROICツリー展開による改善において、各要素間のトレードオフに注意が必要。各要素に対し、分析は意味あるよ
      • ROICも万能ではない
        • 事業が置かれた状況に応じて、重視すべきKPIは変化する

社会人DSとして4年目になって、やりたくもないチームリードをやってみたんだが、これ結構大事じゃねとか思い始めた件

花立 修平さん(日本アイ・ビー・エム株式会社)

  • チームリードやプロジェクトマネジメントについて
    • プロジェクトチームを想定
    • ビジネスにおけるDSのおかれた状況を考えると
      • 複雑な状況に置かれている(色んな立場の人がいろんな事を言う)
      • 個人的経験を拠り所にアクションを起こしがち
    • リードってどうやるんだ?
      • 型なしになってないか?
      • カーゴ・カルトから始める(とりあえず真似する)
      • 実践/観察(データ化)/抽象化による型づくり
      • 先人の知恵を学ぶ
      • 自分にできることは何かを考える
        • WBSをカンバンへ嚙み砕く(締め切り、マイルストーンが見えにくくなるので注意)
        • 情報サイロを破壊する:定例をちゃんとする
    • DS以外のことも勉強してみませんか?
    • 越境し、枠の外へ学びに行きませんか?