第10回 Data-Centric AI勉強会 ~Stability AI特別回~
イベント内容
イベント概要
AI開発における「データ」に着目した取り組みについて、世界的な動向や、様々な人・組織の知見・ノウハウなどを共有するための勉強会です。具体的なテーマとしては、例えばデータ収集の工夫、データ品質の評価・改善、アノテーションの効率化など様々なものが考えられます。データに主眼を置いたものを幅広く対象とします。
今回はStability AI特別回として、Stability AIよりヴァグレ様、澁井様にご発表いただきます!
SNS等におけるハッシュタグは #dcai_jp でお願いいたします。
今後のData-Centric AI勉強会でのご発表を希望される方は以下のフォームよりお申し込みください。
Data-Centric AI勉強会発表申し込みフォーム
タイムテーブル
時間 | 講演者 | 内容 |
---|---|---|
19:00-19:05 | 運営 | オープニング |
19:05-19:30 | ヴァグレ セドリック | 大規模データ管理の課題と解決策 |
19:30-19:55 | 澁井 雄介 | 生成AIのためのデータ収集とエンジニアリング |
19:55-20:00 | 運営 | クロージング |
発表内容
大規模データ管理の課題と解決策
このプレゼンテーションでは、大規模なデータ管理における課題について考察します。小規模では問題にならないような事象が、規模が拡大するにつれてどのように大きな問題に発展するのか、またそれがコストやサービス品質、運用効率にどのような影響を及ぼすのかを説明します。これらの複雑な課題を理解することで、データ管理システムのスケールアップに伴うリスクをより適切に予測し、対応策を講じることが可能になります。
発表者 ヴァグレ セドリック 様
日本では20年以上の、ヘルスケア、オンラインゲームプラットフォーム、音楽など幅広い業界のテクノロジーに携わった経験を持つ。現在は Stability AI のデータ戦略とデータオペレーションをリードする。
生成AIのためのデータ収集とエンジニアリング
生成AIの開発には品質の高いデータが大量に必要になります。だからといってただデータを大量に集めれば良いわけではなく、必要なデータの要件定義や、データのライセンス判定、集め方、整理の仕方等が必要になります。特に生成AIのデータはデータそのもの(たとえば画像)に加えて、そのキャプションテキストやメタデータを組み合わせた構成になることが多く、マルチモーダルなデータセットを整理する必要があります。本発表では生成AIのためのデータ収集から整理するところまで、これまでの経験を踏まえて共有します。
発表者 澁井 雄介 様 (@MlopsJ)
MLOps、インフラ、バックエンド、リサーチエンジニア、テックセールス、ネコ2匹の飼い主。 本業のStability AIでは全般的にいろいろなソフトウェアエンジニアをしています。副業先のmybestでは機械学習とかソフトウェアとかいろいろなエンジニアをしています。
『機械学習システムデザインパターン』
『機械学習システム構築実践ガイド』
会場
オンライン (YouTube Live) で開催いたします。質疑応答はSlidoにて行います。YouTube Live及びSlidoのURLは開催前日に参加者の方にお知らせします。
※後日アーカイブ公開を予定しています。
配信スポンサー
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。