【Sansan×エムスリー】gokartで爆速開発!MLOps勉強会
イベント内容
イベント概要
【Sansan×エムスリー】gokartで爆速開発!MLOps勉強会
エムスリー株式会社とSansan株式会社による合同勉強会です。
MLOpsやデータ活用プロジェクトを推進する上で得られた知見、ノウハウについて、実際の事例を交えながら紹介します。両社は機械学習パイプラインOSSのgokartを利用しています。今回はgokartの実用的なテクニックや事例を紹介し、MLOpsやデータ活用を効率的に推進するヒントをお届けします。
イベント内では、登壇者への質問、議論の時間を設ける予定です。実際の開発者、運用者の肌感覚を含めて参加者全員が吸収し、活用できる機会を提供します。
開発、業務上の知見の共有だけでなく、主催企業についても深く知って頂きながら、「学びがあった」と実感できる時間となる事をイベントの目的としています。
対象
データ分析、機械学習、MLOps、基盤、Data Pipelineに関心のある方
*学生、社会人どちらも参加可能です。
タイムテーブル
時間 | コンテンツ | 講演者 |
---|---|---|
18:50-19:00 | 受付 | |
19:00-19:05 | オープニング | |
19:05-19:15 | gokartをどこでどのように使っているか? | 小松 尚太 / Sansan株式会社 |
19:15-19:25 | 今日から使えるgokart小技集 | 氏家 翔吾 / エムスリー株式会社 |
19:25-19:35 | テーブルデータの推論結果をS3に出力するpipelineをgokartを使って書く | 齋藤 慎一朗 / Sansan株式会社 |
19:35-19:45 | gokartのキャッシュ衝突防止ロック | 池嶋 大樹 / エムスリー株式会社 |
19:45-19:55 | gokartで動かすバッチのコストと実行時間の両立戦略 | 新井 和弥 / Sansan株式会社 |
19:55-20:05 | gokartの分散並列化ライブラリkannonの紹介 | 小栗 悠太郎 / エムスリー株式会社 |
20:05-21:00 | 懇親会 | 美味しい料理とお酒をご用意! |
発表詳細
発表1:小松 尚太 / Sansan株式会社
タイトル: gokartをどこでどのように使っているか?
登壇概要
Sansan技術本部研究開発部では、主にバッチ処理の開発でgokartを利用しています。生産性の向上を図るために、具体的にどういったところでどのように gokart を利用しているかをご紹介します。
登壇者プロフィール
東京大学大学院農業・資源経済学専攻修士課程修了。開発経済学と因果推論を学ぶ。卒業後、インターンとしてコートジボワールの国際農業研究機関に在籍。稲作農民を対象としたフィールドワークや分析、作物多様化に関する調査など、サブサハラ・アフリカにおける農業研究に従事。2020年、Sansan株式会社に新卒として入社し、現在はネットワーク経済学の応用を研究する。
発表2:氏家 翔吾 / エムスリー株式会社
タイトル: 今日から使えるgokart小技集
登壇概要
gokartは標準的なドキュメントが公開されてはいるものの、実用的なテクニックやプロダクトに乗せる上での注意点などはまだまだ普及しているとは言えません。
この発表では、弊社で実際に使われている事例をもとに、gokartを使う上で陥りがちな罠や、実用的なgokartの実装テクニックを紹介します。
登壇者プロフィール
大学では自然言語処理の医療応用について研究し、2021年にエムスリーに入社。ユーザー意向予測モデルの開発や広告運用の改善を担当。
発表3:齋藤 慎一朗 / Sansan株式会社
タイトル: テーブルデータの推論結果をS3に出力するpipelineをgokartを使って書く
登壇概要
gokartのをTaskInstanceParameterを用いたpipelineの実装方法と、データのvalidation・精度確認方法などを、コードベースで紹介します。
登壇者プロフィール
東北大学大学院工学研究科博士前期課程修了。日系SIerや外資系IT企業で、電力・保険・製薬など多様な業界に対する、機械学習を用いたシステムの提案やPoC・開発・保守運用に従事。現在は契約書データの文字認識に関する研究開発を担当。Kaggle Expert。
発表4:池嶋 大樹 / エムスリー株式会社
タイトル: gokartのキャッシュ衝突防止ロック
登壇概要
gokartでは実行済みのTaskの結果がキャッシュファイルとして保存されます。これにより特徴量作成などの複数のプロダクトで共通するようなTaskを共通化することで高速化が可能です。
一方で、複数のプロダクトで同じキャッシュファイルを操作しようとすると、データ読み書きの競合により正しくない結果になる恐れがあります。
この問題を解消するために開発された「キャッシュ衝突防止ロック」機能を紹介します。
登壇者プロフィール
大学で河川シミュレーションを研究した後、2017年にコンサルティング会社にデータサイエンス系のエンジニアとして入社。2019年にエムスリーに入社し、レコメンドエンジンやユーザー意向予測モデルの開発・改善を担当。
発表5:新井 和弥 / Sansan株式会社
タイトル: gokartで動かすバッチのコストと実行時間の両立戦略
登壇概要
パイプライン実行における実行時間と費用はなるべく小さくしたいものです。
本発表では、gokartのキャッシュとAWS EC2のスポットインスタンスを用いて実行時間と費用を抑える工夫を、Kubernetes上での実装とともに紹介します。
登壇者プロフィール
名古屋工業大学大学院工学研究科情報工学専攻博士前期課程修了。
前職ではデータエンジニアとしてBtoB SaaS企業のABMプラットフォームプロダクトの開発に従事。2022年Sansan株式会社入社。研究員とともにDevOps/MLOpsに向き合う。チームの生産性を大切にしている。中部支社勤務。
発表6:小栗 悠太郎 / エムスリー株式会社
タイトル: gokartの分散並列化ライブラリkannonの紹介
登壇概要
gokartのタスクパイプラインの一部をk8s上で簡単に分散並列化できるライブラリkannonを紹介します。
kannonはgokartのラッパであり、複数のk8s jobにタスクを分散して並列で実行することができます。
MLパイプラインではしばしば分散並列化可能な部分が存在しますが、gokartのシングルスレッド実行が障壁となります。kannonはこれを解決するライブラリです。
登壇者プロフィール
東京大学 工学部 電子情報工学科所属のB4。大学では相澤・松井研にて大規模画像検索を研究。2023年3月にエムスリーAIチームにてインターンに参加し、kannonを開発。現在はエムスリーに業務委託として参画。
会社紹介
Sansan株式会社
Sansan株式会社は「出会いからイノベーションを生み出す」をミッションとして掲げ、働き方を変えるDXサービスを提供しています。主なサービスとして、営業DXサービス「Sansan」やキャリアプロフィール「Eight」、インボイス管理サービス「Bill One」、契約DXサービス「Contract One」を国内外で提供しています。
ブログ:https://buildersbox.corp-sansan.com/
エムスリー株式会社
- テックブログ
- エンジニアリンググループ公式Twitterアカウント
- YouTube:エムスリー公式テックチャンネル
- エンジニア採用ページ
∟ テックトークの参加、カジュアル面談はこちらまで
会場について
Sansan株式会社
東京都渋谷区神宮前5-52-2 青山オーバルビル 13F
https://jp.corp-sansan.com/company/info/
※ 表参道駅 B2出口から徒歩4分
注意事項
・本イベントは、各種メディアの取材が入る可能性がございます。予めご了承ください。
・懇親会では、アルコールの提供を予定しています。ご来場の皆さま同士での交流をお楽しみください。
※20歳未満の方の飲酒は固くお断りいたします。
・当日会場にて申込を確認させていただく場合がございます。
・会場内はWi-Fiを用意しております。
・電源の用意はございませんので予めご了承ください。
・イベントの様子(写真)・内容をまとめ、後日公開させていただく予定です。
・技術交流が目的の勉強会のため、知識の共有および参加者同士の交流を目的としない参加はお断りしております。
・参加枠が大幅に埋まらない場合には開催を延期または中止する場合がございます。
・参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
・会場は禁煙となっております。
・個人情報取扱いについて
https://jp.corp-sansan.com/privacy/https://corporate.m3.com/privacy/
に定める利用目的に必要な範囲で利用し、当社が責任をもって厳格に管理いたします。内容をご確認の上、ご同意いただきお申込みください。
■アンチハラスメントポリシー
本イベントはアンチハラスメントポリシーを定めております。参加者は内容をご確認、ご同意の上でご参加をお願いします。
本イベントでは、特定の社会的属性――ジェンダー・性自認・性的指向、障がい、外見・身体的特徴、エスニシティ・国籍、年齢、宗教、特定のツールやプログラミング言語、専門とする学問領域、教育的バックグラウンドなど――に基づく差別的言動を、一切許容しません。 加えて、参加者による以下のような行為を、SNS、イベント会場等問わず禁止します。
・攻撃的な発言
・脅迫行為
・ストーキング行為
・つきまとい
・不適切な接触
・性的な画像の掲示などを含む不適切な情報の開示
・その他、事務局が不適切と判断した行為
参加者がこれらの行為に加担した場合、事務局側は当該参加者に対し必要な処分を行うことができます。この処分には、当該参加者への勧告、今後のイベントに聴講者・登壇者として関わることの禁止などを含みます。また、今後のよりよい運営のために、事態の詳細をレポートとして公開する場合があります。
本サービスの中で、「これはハラスメントではないか?」と感じたり、他の誰かがハラスメントを受けていることに気が付いた場合、または事務局側の体制がこれらのポリシーを満たさないと感じることがあった場合には、以下までご連絡ください。
mail:33tech@sansan.com
以上、イベントの健全な運営のため、ご協力をお願いします。
その他、ご不明点などございましたら、遠慮なくご連絡いただけますと幸いです。
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。