第5回 Data-Centric AI勉強会
イベント内容
イベント概要
AI開発における「データ」に着目した取り組みについて、世界的な動向や、様々な人・組織の知見・ノウハウなどを共有するための勉強会です。具体的なテーマとしては、例えばデータ収集の工夫、データ品質の評価・改善、アノテーションの効率化など様々なものが考えられます。データに主眼を置いたものを幅広く対象とします。
今回はウォンテッドリー 合田様、Cyber Agent 兵頭様から2件の発表です!
SNS等におけるハッシュタグは #dcai_jp でお願いいたします。
今後のData-Centric AI勉強会でのご発表を希望される方は以下のフォームよりお申し込みください。
Data-Centric AI勉強会発表申し込みフォーム
タイムテーブル
時間 | 講演者 | 内容 |
---|---|---|
19:00-19:05 | 運営 | オープニング |
19:05-19:30 | 合田 周平 | 会社訪問アプリ「Wantedly Visit」でのシゴトに関する興味収集と推薦活用 |
19:30-19:55 | 兵頭 亮哉 | 公開データセットの再アノテーションで精度向上 |
19:55-20:00 | 運営 | クロージング |
発表内容
会社訪問アプリ「Wantedly Visit」でのシゴトに関する興味収集と推薦活用
Wantedlyは、多様なユーザーと会社を理想的にマッチングさせるため、会社訪問アプリ「Wantedly Visit」の推薦システムの開発に注力しています。新規登録ユーザーの情報不足から生じる推薦精度の低下、いわゆるコールドスタートの問題を解消するため、2021年にシゴトに関する興味を選択する機能とそれに基づいた推薦を導入しました。本発表では、この機能開発の過程での取り組みや、その中で得られた高い興味選択率や正確な興味情報の選択を促すための工夫について紹介します。
発表者 合田 周平 様 (@hakubishin3)
2019年にウォンテッドリー株式会社にデータサイエンティストとして中途入社。推薦システム・機械学習領域のテックリードやプロダクトマネージャーとして、会社訪問アプリ「Wantedly Visit」の開発・運用に従事している。Kaggle Competitions Grandmaster。
公開データセットの再アノテーションで精度向上
- 再アノテーションをするモチベーション(mAP 22.0低すぎ? 論文の指標の2分の1)
- 精度向上の結果
- データクレンジングの方針
- 対象に選定した公開データセット
- クレンジング経過ごとの学習の進み方(Lossの上下動の傾向)
- クレンジングステージごとの精度
- トレーニングデータとバリデーションデータを同時にクレンジングして毎回Split
- 官能評価による性能評価
発表者 兵頭 亮哉 様 (@PINTO03091)
16年間SIerにてシステム開発やR&Dに従事。前職でR&Dチームのマネージメントを経験したのち、2021年に Cyber Agent AI Lab のリサーチエンジニアとして中途入社。NNモデル構造のフレームワーク最適化 ならびに フレームワーク間NNモデルコンバージョンに強み。 Intel Software Innovator。 OpenCV AI Kit(OAK)のVPUを利用した初期開発コンセプト提供者。 OpenCV Spatial AI Competition 2020 優勝作品へコントリビュート。 Cyber Agent AI Lab Agent Development Team Research Engineer / Developer Experts (MLモデルチューニング・EdgeAI)
会場
オンライン (YouTube Live) で開催いたします。質疑応答はSlidoにて行います。YouTube Live及びSlidoのURLは開催前日に参加者の方にお知らせします。
※後日アーカイブ公開を予定しています。
配信スポンサー
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。