機械学習基盤 本番適用と運用の事例・知見共有会

2020/11/06(金)14:00 〜 17:30 開催
ブックマーク

イベント内容

このイベントは、機械学習工学研究会 本番適用のためのインフラと運用WGが主催するオンラインカンファレンスです。

開催にあたって

機械学習システムを本番適用するためには、様々な自明ではない課題をクリアし各自工夫を凝らしてきているかと思います。このカンファレンスでは、皆様が実際に関わってきたシステムの構築の中で得られた知見を共有し、一つでも多くの機械学習システムの課題意識やベスト/ベタープラクティスを互いに取り入れることで、個々を超えた知見の創出を狙えたらと思い開催します。一つでも多くの機械学習システムの共通課題が見出せたらと思い開催します。

実際の基盤構築の際に学んだこと、構築には失敗してしまったが得られた教訓などを発表していただきたく思います。すでに完成したシステムの話はもちろんのこと、現在進行形の話であっても、そこから得られた学びを共有し議論できればと思います。

登壇者の連絡及び参加者のコミュニケーションには MLSEのSlack#20201106-機械学習基盤本番的湯と運用の事例知見共有会チャンネルを利用しますので、併せてぜひ参加ください。

当日の配信は、MLSEのYouTubeチャンネルで実施します。

YouTube配信とsli.doのリンク

配信はYouTube Liveの以下のリンクで行います。

YouTube Live - https://www.youtube.com/watch?v=nNFCc3nowfg

当日の質問は以下のsli.doで行います。 - https://app.sli.do/event/j7kg9csa

発表スケジュール

時間 タイトル 発表者
14:00-14:10 はじめに
14:10-14:40 ゼロから始める Kubeflow での機械学習パイプライン構築 Asei Sugiyama (Repro, Inc.)
14:40-15:10 リーガルテックにおけるMLOps構築事例の紹介 Keita Iwamoto (LegalForce)
15:10-15:40 プレイドにおけるバッチ、リアルタイム基盤の事例紹介 西村 優汰, Akira Kasuga (PLAID, Inc)
15:40-16:00 休憩
16:00-16:30 モバイル向け機械学習モデル管理基盤 大嶋 悠司 (メルカリ)
16:30-17:00 大規模・複雑な機械学習プロダクトの継続的な改善を支える実験プラットフォーム 大西 健太 (Mobility Technologies)
17:00-17:10 おわりに

発表詳細

14:10- ゼロから始める Kubeflow での機械学習パイプライン構築

Asei Sugiyama (Repro, Inc.)

Reproでは機械学習を利用する開発チームがありましたが、昨年2名を残して解散しました。また、ノウハウもメンバー内に暗黙知化していたため、チームメンバーとともに散逸してしまいました。 このセッションでは我々のチームが機械学習基盤を必要としたきっかけから、要求仕様の策定のためにゼロから業務フローの定型化を行い、TFXの設計思想に基づいてパイプラインの設計を行い、Kubeflow を基盤として選定し、実際にバッチを基盤の上で動かすまでの道のりと、そこで経験した課題について共有します。

14:40- リーガルテックにおけるMLOps構築事例の紹介

Keita Iwamoto (LegalForce)

LegalForceの研究開発では自然言語処理や機械学習を用いた法務向け契約書レビュー支援システムを開発しています。 機械学習システムの開発においては、機械学習を始めるまでのデータの収集やインフラの立ち上げ、デプロイやモデルの管理などに課題がありました。 そこで、機械学習基盤(MLOps)の構築を行いましたが、機械学習基盤の構築においてはツールの比較検討を含めた試行錯誤がありました。 本発表では弊社の機械学習基盤の構成やそこに至る過程をご紹介いたします。

15:10- プレイドにおけるバッチ、リアルタイム基盤の事例紹介

西村 優汰, Akira Kasuga (PLAID, Inc)

株式会社プレイドでは、webやappに訪問したエンドユーザーの行動をリアルタイムに解析し、行動に応じたアクションを提供できるKARTEを開発しています。エンドユーザーの行動データから機械学習のモデルを作成するパイプライン、また、予測をバッチ、リアルタイムの両軸で行う基盤の事例紹介をいたします。

16:00- モバイル向け機械学習モデル管理基盤

大嶋 悠司 (メルカリ)

これまで機械学習を使った機能は,サーバ上にモデルを配置しクライアントからAPI経由で呼び出すことが一般的でした. しかしモバイル端末の高性能化によって,モバイル端末上でMLモデルの推論を行うことが可能になってきています. それによってインターネット越しにAPIを呼ぶ必要がなく,高速かつセキュアなML機能を実現することができるようになりました. しかしMLモデルの推論をサーバ上で行う場合に比べ,モバイル端末上ではモデルサイズや推論速度の制限が厳しく,多くのハードウェア上での動作を保証しなくてはなりません. メルカリではそのようなモバイル端末上で動作するMLモデルを管理するための機械学習基盤を構築し,モバイル上で推論を行う機能を開発しています. 本発表ではその基盤についてお話します.

16:30- 大規模・複雑な機械学習プロダクトの継続的な改善を支える実験プラットフォーム

大西 健太 (Mobility Technologies)

Mobility Technologiesでは, 交通事故削減支援を行う次世代AIドラレコサービス「DRIVE CHART」を提供している. このプロダクトでは, ドライバの危険なアクション (脇見や車間距離の詰めすぎなど) を検知するロジックがコアな機能となる. エッジデバイスで軽量なディープラーニングモデルを用いて特徴抽出し, サーバで学習モデルやルールベースで検出処理を行っている. さらに, 一部では動画を入力としたエンドツーエンドの重厚なディープラーニングモデルを検出処理に加えている. これらを多段のプロセスを総合してドライバへレポートしている. これらのインテリジェンスを、20名超のデータサイエンティストとコンピュータビジョンリサーチャが専任で開発している. こうした複雑な機械学習システムを大人数で実装・実験するための環境に求められる要件を, 大きく3点にまとめた. (1) ある特定の検出処理単体の修正など, 影響範囲が限定される変更に対して, 各人の変更だけを反映し, それ以外はプロダクション同等の環境を再現して実験ができること. (2) エッジデバイスのモデルの更新など, システムパイプライン全体に影響を与える変更に対して, 入力となる特徴抽出から最終出力となる検出まで一貫した結合試験を実施できること. (3) これらの実験を様々な役割・バックボーンを持つメンバが, 同時・独立・容易に実施できること. これら要件を実現するために, 我々はKubeflow + Amazon Web Serviceで実験環境を構築・運用している.

Call for Proposal

募集は締め切りました。ご応募ありがとうございました。

  • 締め切り: 2020/09/30

SessionizeでCall for Proposalを募集します。奮ってご応募ください

https://sessionize.com/mlse-opwg-ws

想定されうるトピックとして、以下に限りませんが一例として紹介します。

  • 探索的データ分析、実験、学習、本番系での予測も含むパイプライン、統合的機械学習基盤
  • モデルのライフサイクル管理・デプロイ、ガバナンス、サービング
  • feature storeやデータのバージョン管理、ガバナンス
  • 既存システムとの連係、要件や技術の変化への対応

スケジュール

  • 9月30日: 発表募集終了
  • 10月中旬: 採択通知。スケジュール発表
  • 10月19日: 参加申込開始 (MLSE connpassにて通知します)
  • 11月6日: カンファレンス開催

資料について

資料は発表後、原則1週間以内に公開をして頂く予定です。

その他

  • スケジュールなど本ページの掲載内容は状況により変更する場合がありますので予めご了承ください。

主催

日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG

幹事:Treasure Data 有賀、NTTデータ 土橋

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント