DeepSpeed Meetup in Japan
イベント内容
DeepSpeed Meetup in Japan
- 日時: 2024/5/23(木) 18:00-
- 場所: 日本マイクロソフト(株) 〒108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー
セミナールーム C+D
DeepSpeed は、Microsoft が公開している深層学習を大規模・高速に実行するためのオープンソースソフトウェアです。先日公開した Phi-3 や、BLOOM (1760億パラメータ), Megatron-Turing NLG (5300億パラメータ、発表当時世界最大) を始めとする、多くの大規模言語モデル(LLM)の学習に広く使用されています。 このミートアップでは、すでに DeepSpeed を用いて LLM 学習に取り組んでいる方や、LLM 学習の大規模化や高速化を目的に DeepSpeed の利用を検討している方などを対象に、DeepSpeed チームの主要メンバからの概要紹介、ユーザ企業様からの講演を行います。 また、一連の発表の後、講演者とユーザのネットワークキングのための時間を設ける予定です。
プログラム(予定)
時間 | セッションテーマ | 登壇者 |
---|---|---|
17:30 | 受付・開場 | |
18:00 | 開演 | |
18:00 - 18:30 | DeepSpeed 概要紹介 深層学習の大規模化・省リソース化や、高速な推論など、DeepSpeedの主要な機能について、ユースケースと共に紹介します。 |
■ 田仲正弘, Principal Researcher, DeepSpeed, Microsoft Corporation |
18:30 - 19:00 | 大規模言語モデル: Rakuten-AI-7B 2024年3月に楽天グループ株式会社では大規模言語モデルRakuten-AI-7Bを発表しました。Nejumiリーダーボード上では、同程度のサイズの他モデルに対して、精度が大きく上回っております(+33% from 2nd)。このセッションでは、Rakuten-AI-7Bの開発におけるデータセットの作成と、モデルの学習について説明いたします。 (一部英語での講演になります) |
■ 高橋直紀, Senior Machine Learning Engineer, Machine Learning and Deep Learning Engineering Department, 楽天 ■ 王 晨光, Data Scientist, Search Department, 楽天 |
19:00 - 19:30 | マルチモーダル学習ライブラリ「Heron」と自動運転への応用 完全自動運転車の開発を進めるTuringは、マルチモーダルモデルの学習ライブラリHeronを公開・開発しています。VLMモデルの学習方法や評価ベンチマーク、自動運転への応用について紹介します。 |
■ 山口祐, Director of AI, Turing |
19:30 - 20:00 | パネルディスカッション 深層学習基盤ソフトウェア開発・運用の最前線 司会: 田仲 正弘, DeepSpeed, Microsoft Corporation パネリスト: ■ 秋葉 拓哉, Research Scientist, Sakana AI ■ 横田 理央, 東京工業大学 教授 ■ 山口 祐, Director of AI, Turing株式会社 ■ 吉藤 尚生, LLM R&D Center 開発責任者, 株式会社フィックスターズ (敬称略) |
|
20:00 - 20:30 | ネットワーキング |
なお、現地参加の人数の制限のため、参加のご希望に添えない場合はご了承ください。
ネットワーキング
アンケートにて参加・不参加の表明をお願いします。
個人情報について
ご提供いただいた個人情報は、以下の目的にのみ利用いたします。
- イベント開催会場への入館申請手続き
- 参加者を識別できない形式による統計情報の収集
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。