「白金鉱業 Meetup Vol.12」に参加したので、まとめました
(間違っている点があった場合、指摘いただければ助かります)
どんなイベント?
ブレインパッドのデータサイエンティスト/機械学習エンジニアが社外のデータ系の仕事をしている人と交流したい!と始まった勉強会兼交流会です。気持ち的には交流会がメインです。同業の方も超welcomeです!
月イチくらいで継続的にゆるく開催し、発表社は業界/ジャンルを問わず、毎回社内外から広く立候補形式で募集しています!
brainpad-meetup.connpass.com
グラフ構造データに対する畳み込みの定義について実データを使いながら噛み砕く
濱本 章弘さん(日本アイ・ビー・エム株式会社)
- グラフ畳み込みニューラルネットワークを直観的に理解することについて
- グラフについて
- Convolutionについて
- Graphと2D Convolutionの違い
- Filterの形が一定でない
- Filterの動かし方を定義できない
- GCNには2種類
- Application:化学分野で最近活発なイメージ
- 言語間の相関等を利用したグラフについて実際に分析した結果(Shakespeare's Plays Network)
- Networkrepository.comの紹介
networkrepository.com
因果推論の基礎とその罠
仁ノ平 将人さん(株式会社ブレインパッド)
資料
t.co
- 因果推論の基礎について
- そもそも因果推論って?
- 因果推論~施策の本当の効果~
- 難しいポイント
- 次元が大きいと類似度計算が難しい
- ランダム化比較試験が難しい
- そもそもテスト/コントロール群にしかないデータがある(バイアスがある)
- 反実仮想
- 傾向スコアの導入
- 条件:強く無視できる割り当て
- 共変量xが同じであれば、割り当てzと目的変数の同時分布は独立
- 割り当てを確認する方法→便利な公式は存在せず、圧倒的なドメイン知識がいる
- 条件を満たすと傾向スコアマッチングが出来るようになる
- 傾向スコアモデリングと罠
- 傾向スコアを推定するモデルの学習
- c統計量で評価:たまに0.7以上という見解があるか本当なのか?
- 傾向スコアの分布:ヒストグラムがtestとcotrolで左右対称かが大事になる
- マッチング
- Standard Differenceで評価:どの共変量を使う?モデル作成の際にimportanceが高い共変量に対してSDを見る
- テストかコントロールのどちらかのデータが少ないと問題生じやすい
- 結局ABテスト最強
企業価値とデータ分析「その分析いくら儲かるの?」に超本気で向き合う
野口 友熙さん(株式会社ブレインパッド)
- 「企業価値と分析」のお気持ちを感じてもらう
- 企業価値とは?
- 会社全体の経済的価値
- 日々の全ての活動が企業価値の向上に寄与している(と信じている)
- 分析が企業に与えるインパクト
- 分析の基本は比較
- 企業価値向上に重要な指標たち
- ROIC経営
- オムロンROIC経営における特徴:ROIC翻訳式、ROIC逆ツリー展開
- ROICツリー展開による改善において、各要素間のトレードオフに注意が必要。各要素に対し、分析は意味あるよ
- ROICも万能ではない
- 事業が置かれた状況に応じて、重視すべきKPIは変化する
社会人DSとして4年目になって、やりたくもないチームリードをやってみたんだが、これ結構大事じゃねとか思い始めた件
花立 修平さん(日本アイ・ビー・エム株式会社)
- チームリードやプロジェクトマネジメントについて
- プロジェクトチームを想定
- ビジネスにおけるDSのおかれた状況を考えると
- 複雑な状況に置かれている(色んな立場の人がいろんな事を言う)
- 個人的経験を拠り所にアクションを起こしがち
- リードってどうやるんだ?
- 型なしになってないか?
- カーゴ・カルトから始める(とりあえず真似する)
- 実践/観察(データ化)/抽象化による型づくり
- 先人の知恵を学ぶ
- 自分にできることは何かを考える
- WBSをカンバンへ嚙み砕く(締め切り、マイルストーンが見えにくくなるので注意)
- 情報サイロを破壊する:定例をちゃんとする
- DS以外のことも勉強してみませんか?
- 越境し、枠の外へ学びに行きませんか?