JDLA勉強会 #13「LLM推論の課題と最適化技術」

2024/08/27(火)14:00 〜 15:00 開催
ブックマーク

イベント内容

JDLA勉強会とは?

JDLA勉強会はJDLA会員とCDLEメンバーの知見を広げるためにディープラーニングの有識者を招いて行う勉強会です。 このイベントはG検定・E資格合格者、JDLA会員のみが参加出来ます。

今回は

第13回目のJDLA勉強会は、NVIDIAによる [「LLM推論の課題と最適化技術 〜NVIDIA NIMで実現する効率的な推論〜」] です。

企業におけるLLMの活用が広がっている一方で、プロダクション環境へのLLMの展開・推論の効率化が課題となっています。 本勉強会では、LLMのデプロイ・推論に関する技術的チャレンジとそれらを解決する技術を解説します。 また、NVIDIAが提供する推論ソフトウェアである NIMを活用して最適化されたLLMを簡単にデプロイする方法と、 NIMがどのように効率的な推論を実現しているかの技術的バックグラウンドもご紹介します。

講師プロフィール

・NVIDIA シニアディープラーニングソリューションアーキテクト 山本 小太郎 氏

NVIDIAのソリューションアーキテクトとして、ディープラーニングに関する顧客への技術支援を担当。 大学卒業後SEとして開発に従事する中、2018年にBERTの出現を見てディープラーニングの活用に取り組みはじめる。 その後AIスタートアップでMLエンジニアとしてモデル開発からプロダクション環境へのモデルデプロイや最適化を担当し、2024年2月より現職。 得意分野は推論フェーズにおけるTransformerの高速化やモデルコンパイル・量子化などの最適化技術。 開発者に対して、LLMの推論を効率化するNVIDIA NIMの利用を促進する活動も行っている。

スケジュール

時間 内容 発表者
14:00 ~ 14:05 開会挨拶 日本ディープラーニング協会
14:05 ~ 14:45 「LLM推論の課題と最適化技術 〜NVIDIA NIMで実現する効率的な推論〜」 NVIDIA 山本 小太郎
14:45 ~ 14:50 NVIDIA からの最新オファー NVIDIA 藤山裕子
14:50 ~ 15:00 質疑応答 質疑応答モデレータ CDLEメンバーより
15:00 閉会

日本ディープラーニング協会の YouTube チャンネル

今回は YouTube Live で配信します。この機会に是非日本ディープラーニング協会の YouTube チャンネルにご登録ください。 https://www.youtube.com/c/JDLA2017

質疑応答

質問は YouTube のチャット欄に書いてください。質問された内容は質疑応答モデレータから講師に質問します。 ただし全ての質問に対応することが出来ない場合がありますので、ご了承ください。またチャット欄に書き込むためには JDLA の YouTube チャンネルに登録する必要があります(YouTube のチャットは荒れ易いので、このような設定にしています)。

注意事項

  • このイベントはオンラインで行います。
  • このイベントは JDLA 会員及び G 検定、E 資格合格者本人 のみが参加出来ます。
  • このイベントは収録され、後日日本ディープラーニング協会のYouTubeチャンネルで公開されます。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
情報提供元ページ(connpass)へ

新規会員登録

このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。



※ ソーシャルアカウントで登録するとログインが簡単に行えます。

※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。

関連するイベント