データ分析関連のまとめ

データ分析・機械学習周りのもくもく会LTやイベント参加をまとめていきます

Machine Learning Nightに参加しました

【Merpay x M3 x PFN 共催】 Machine Learning Nightに参加しました。 (間違っている点があった場合、指摘いただければ助かります)

どんなイベント?

Machine Learning Production Pitchは、機械学習について業務で培った知見や経験や苦労話を共有できる場を提供することを目的としたMeetupです。機械学習に取り組み、実社会への適用に日々もがき苦しみ楽しんでいる方々を対象としております。

今回は機械学習を実際の製品やサービスとして提供している、Merpay、M3、Preferred Networksの3社合同で普段はなかなか聞けない具体的な取り組みについて発表していただきます。

machine-learning-pitch.connpass.com

LT

医師向け推薦システムや、アンケート結果と組み合わせた行動ログ解析についてのLTがありました。

MerpayにおけるML活用のポイント

  • MerpayのMLチームや気を付けていることについて
    • MLチームについて
      • Data platform
      • Data analyst
      • Machine leaning
    • 課題発見、モデリング、マイクロサービスの提供まで行う
    • PJO-TL-EM体制
    • プロジェクト
      • メルペイスマート払い
        • メルカリ、メルペイの取引情報等から与信枠を設定
      • AML(マネーロンダリング対策)
        • 不正行為や疑わしい行為の検知
    • 気をつけていること
      • 施策を円滑に遂行するために(アドホックにやらない)
        • チームの3か年ロードマップを作成(3ヵ月毎に更新)
        • メンバーだけでなく、経営陣等とのステークホルダーとの円滑なコミュニケーション
      • ソフトウェアエンジニアとして課題を解く
        • 実務でのMLシステムは精度の良いモデルだけでは不十分
        • 業務プロセスの把握→モデル以外にも必要な部品の実装する必要
      • その他大切にしていること
        • 解くべきお課題にフォーカスする(ビジネスインパクトを重視)
        • ショートサイクルで漸進的に磨きこみを×
        • 問題に適した正しい技術選定
          • いきなりDeep Learningを使う事はしない、ルールベースの運用もある
        • 技術面の進化も追うようにしている

Preferred Networksの顧客向けプロダクト開発

  • 研究環境、プロダクト開発チーム、インフラ・アプリケーション構成について
    • 研究環境
      • 民間企業の計算資源として国内最大級のGPU
        • 工作機械、パーソナルロボット、スポーツ等
    • 今年:プロダクト開発チームの発足
      • 体制
        • 顧客毎に研究チーム、
        • 研究チーム毎にエンジニアが主担当としてつく
        • インフラ:AWS
          • 開発環境:コスト削減のため共有
          • 本番環境は顧客ごとに作成(プライバシー保護)
    • アプリケーション構成
      • ドメインが同じ顧客は共有のロジック
      • マイクロサービス化することで開発分担、デプロイを容易にしている
      • プロジェクト毎に主担当がアプリケーション構成を検討、決定している
        • 極力テンプレート化することで技術移管も行いやすくしている

パネルディスカッション

MLをどうビジネスに結び付けてきたのか?

  • Preferred Networks:
    • 研究→企業と一緒にどう事業化していくかをディスカッション
    • 研究段階で開発以降の内容を握る
  • メルペイ:
    • 始まったタイミングでデータをためる組織が組閣されていた
    • ビジネスのコアを見極めて提案するのはMLエンジニアから
  • エムスリー
    • R&Dではなく、事業から始まった
    • ルールベースの横展開→プロダクトに円滑に入りやすかった

自社のポリシー

  • メルペイ

    • MLエンジニア:新しい物好き
    • 研究:今の技術では解決できないものを解決するためのもの
  • Preferred Networks

    • 共同研究先:大企業のため、その企業のやりたいことを行う(事業化は頭に入れている)
    • クライアントが問題設定してしまっている状態はあるか?
      • ある。しかし、そうならないようにプロダクト開発チームが先に入り、サポートしながら進めている
  • エムスリー

    • 地に足ついた内容が多い。目の前のやれる事を着実に進めている

プロダクトに落とし込むとき、どこまでカバーするか?

  • エムスリー

    • プロダクトに落とし込む所まで基本的に責任を持つ
    • MLは性質上障害おきやすいので、それを想定した運用
  • メルペイ

    • フロントまではしないが、基本的に責任を持つ
    • 運用負荷がかからない形にする(夜間バッチ→週次バッチ)
  • Preferred Networks

    • アプリ開発チームが無かったので、自分達で運用環境も作っている

採用時、プロダクトの落とし込みまではやりたくない人がいた場合どうするか?

  • Preferred Networks
    • 結構特殊で、研究者:先進的な研究に特化
  • メルペイ
    • 機械学習だけをする思考の人はいない
    • モデリングだけやっている訳ではないので、採用時にコミュニケーションを取っている
  • エムスリー
    • 採用時にプロダクトへの作りこみまでする事は言っている

解決したいけど、難易度の高い課題

  • Preferred Networks

    • 推論サーバーをどう作るか?
      • 研究者が作ったコードをプロダクトに反映できるように調整する
      • インターフェースの統一等が必要
  • メルペイ

    • 完全フルオートマチックではない運用をしているものを、どう上手く人とMLの融合に結びつけるか?
  • エムスリー

    • どういうプロダクトを作るか?
      • 解決すべき問題が正しいか?
      • プロダクトマネージャーの存在が必要

感想

様々な企業の考えている、実施している事を聞く事が出来大変有意義でした。
懇親会で話題になったのですが、技術がわかり事業を動かせるプロジェクトマネージャーは欲しい企業が多いので、キャリアパスとして良い選択肢だと再度認識しました。