【Pre-trained Model #03】ゼロショット学習を徹底解説 ハンズオン
イベント内容
イベント概要
【Pre-trained Model #03】機械学習エンジニアがゼロショット学習を徹底解説 ハンズオンは、強力な事前学習済みモデルを活用して、新たにデータを集めたり学習を行わなくても、様々なタスクに柔軟に対応できる手法「ゼロショット学習」について学ぶ講座です。
3回に渡りお届けした NABLab. 主催【Pre-trained Model #03】勉強会の最終回です!
前回の【プロンプトエンジニアリング】含め、約500名の方がご参加下さりたくさんの反響を頂いた勉強会です!
#03 からのご参加でも大丈夫です!
本講座では、下記の 6 つのタスクについて事前学習済みモデルの簡単な理論から、実装コード、ユースケースまで紹介し、ゼロショット学習の実践的活用方法についてハンズオン解説します。
なお、本講座で紹介するコードは、Google Colab の無料版で動かすことを前提に記述しています。 (一部、事前学習モデルのサイズが大きい場合は Colab Pro, GCP, AWS などの有料サービスが必要な箇所があります)
📝講座内容
0章 基礎編 Introduction
1章 実践編 画像分類
2章 実践編 画像キャプショニング
3章 実践編 画像生成
4章 実践編 セグメンテーション
5章 実践編 Speech-to-text
6章 実践編 音声生成
※講座の内容は、予告なく変更されることもあるのでご注意ください。
本講座では、これまで機械学習に関する学術的なバックグラウンドをお持ちでいない方にも理解いただけるよう、数式などを用いた詳しい理論の説明は最小限とし、各モデルの概要やユースケースを中心に紹介します。
💻こんなエンジニアにおすすめ
・ 機械学習プロジェクトに関わるデータサイエンティスト
・ 機械学習プロジェクトの実施をしたいビジネスサイドの方
・ 深層学習や機械学習に興味のある開発エンジニア
📖ハンズオンの内容
- 1章 実践編 画像分類
- CLIP/Japanese Stable CLIP の実装、解説を行います
- 2章 実践編 画像キャプショニング
- Coca/BLIP & BLIP2/Japanese InstructBLIP Alpha の実装、解説を行います
- 3章 実践編 画像生成
- DALL-E/Japanese Stable Difffusion XL の実装、解説を行います
- 4章 実践編 セグメンテーション
- Segment Anything Model (SAM) の実装、解説を行います
- 5章 実践編 Speech-to-text
- Whisper の実装、解説を行います
- 6章 実践編 音声生成
- VALL-E X の実装、解説を行います
🚀ハンズオン事前準備のお願い
ハンズオンではご参加頂いた皆様の手元で Google Colab を操作、Hugging Face と OpenAI API をご利用いただきます。
【 Google Colaboratory 】
- Google アカウントにログインしている状態で、Google ドライブへアクセスします。
- 左上の「新規」ボタンをクリックし、メニューの中の「その他」の中の「アプリを追加」をクリック、検索枠で「Colaboratory」を検索し、アプリをインストールします。
- ドライブ左上の「新規」ボタンをクリックし、メニューの中の「その他」から「Google Colaboratory」を選択し、ファイルを立ち上げて下さい。
【 Hugging Face 】(02_image_classification.ipynb)
- Hugging Face のウェブサイトにアクセスし、 右上の Sign up ボタンからアカウントを作成します。
- アカウント作成後、stabilityai/japanese-stable-clip-vit-l-16 のページにアクセスしてください。 モデルのライセンス条項に対する同意が求められますので、内容を確認した上で、同意してください。
【 OpenAI API 】(04_image_generation.ipynb)
- OpenAIのアカウント登録
- APIキーの発行
- クレジットカードの登録
- 利用上限の設定 ※無料クレジットが設けられておりますが、決済手段の登録が必要となっておりますのでご注意ください。
※上記の環境が難しい場合は、視聴のみでの参加となります。
🎤登壇者
石上 亮介 氏
株式会社サイバーエージェント Kaggle Master 株式会社サイバーエージェント AI事業本部で「極予測LP」の開発、大規模言語モデル(LLM)をはじめとした「基盤モデルプロジェクト」のリードを担当。画像やテキストを対象としたマルチモーダルなAIの社会実装に従事している。
X:@rishigami_
📝Node Writer(教材開発者)
吉原 洸平 氏
金融企業のIT部門に所属 Kaggle Competition Expert
X:@kohecchi
注意事項
・当イベントの内容およびスケジュールは予告なく変更となる場合があります。予めご了承ください。
・当イベント内でのリクルーティング活動や勧誘等につきましてはご遠慮いただいております。
・ブログやSNS等で当イベントに関する発信を行う際は、公序良俗に反する内容の無いようご協力をお願いします。
・オンラインで参加される方につきましては、双方の通信状況により音声や映像に乱れが生じる場合がございます。
・※ご自宅のインターネット環境、視聴環境に伴う不具合に関しては、主催者は責任を負いかねます。
・配信トラブル時のアナウンスはTwitterよりイベントハッシュタグをつけて行います。
・配信映像の商用利用や無断転載は禁止とさせていただきます。
主催NABLAS株式会社について
当社、NABLAS株式会社は東京大学発のベンチャー企業であり、AI人材教育・育成機関、そして最先端のAI技術、特にDeep Learning技術を活用したソリューションを提供するAI総合研究所です。
AI人材育成事業では、東京大学で開発したAI人材教育コンテンツと当社でアップデートしたコンテンツを学習環境iLect Systemと共に、AI人材育成サービスとして提供しています。
R&D事業では、AI技術の導入・開発など技術面でのサービス提供を行なっています。AI技術の社会実装を様々な形で実現し、人・テクノロジー・社会問題を繋げ、人が人らしく生きられる社会の実現へ貢献していきます。
■個人情報の取り扱い 本イベントに参加する際は下記個人情報の取り扱いに同意の上、お申込みください。
NABLAS株式会社 プライバシーポリシー
📌iLect
NABLAS社が運営するAI人材育成・人材開発サービスのブランドです。
国内最高水準の講師陣、東京大学から正式にライセンスを受けている教育プログラム、AIに関する先端的な研究に従事するスタッフが中心となったサポート体制など、特色のある講座を提供しています。
講義内で実施する演習には、独自に開発したプログラミング環境iLect Systemをご利用いただきます。Webブラウザ上からアクセス可能なGPU環境を利用できるため、事前の環境構築は不要です。より高い精度のAIモデルを目指して作りながら、実践的な技術やテクニックを学べる仕組みを整えています。
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。