AIとPythonで音声から書き起こし!OpenAIのWhisperを無料で使いこなすハンズオン
イベント内容
お申し込み後、本ページ上部の「参加者への情報」にYouTubeLiveの配信URLが表示されます。お申込者様への限定公開でアーカイブを残しますので、リアルタイムに参加できない場合もお申込み下さい!
本イベントに参加するにあたり、インストール・ログイン・カメラ・マイクなど一切不要で、YouTubeLiveを視聴するだけでOKです。 匿名で投稿できるチャットも準備しておりますので、ライブ中に気軽に質問も可能です。
概要
OpenAIのWhisperを使ってPythonで音声ファイルから書き起こしを行うハンズオンを行います。ハンズオンはこちらが準備したものを使用するため、インストール等の事前準備は不要です。
Whisperとは?
WhisperはOpenAIが提供する汎用の音声認識モデルです。多様な音声の大規模なデータセットでトレーニングされており、日本語を含む多言語音声認識、音声翻訳、言語識別を実行できるマルチタスク モデルでもあります。MP3やWAVなどの音声ファイルの他にMP4などの動画ファイルを入力として、テキスト書き起こし可能です。
簡単なコード記述で使いこなしを学ぶ
Whisperにはtiny、base、small、medium、largeなど様々なモデルがあります。またCPUとGPUで実行速度が異なります。ローカル環境で構築する際の注意、さらに本家Whisperを超える実行速度を出す他のオープンソースの紹介など、検証しながらハンズオンを行います。
本イベントについて
プログラミング言語としてPythonを使用しますが、ハンズオンはこちらが準備したブラウザ上のColaboratoryを使います。Googleアカウントのみ用意していただければ、事前にインストールや環境設定などの準備は必要ありません。一緒に作業しても良いですし、見ているだけでもOKです。簡単なコマンドとコードのみですので、初心者の方でも問題ありません!
得られること
対象者
背景
イベントを実施する背景として、こちらの「ものものテック」というサービスがあります。
「ものものテック」は、AI・IoT・ロボティクスを中心とした、オンラインで学べる技術教育サービスです。いつでもどこでもウェブブラウザで文章・画像・動画を見ながらコードを実行し自主的に学べます。本イベント内容に加え、「ものものテック」でさらに深く学んでいただければと思います。
タイムテーブル
時間 | 内容 | 詳細 |
---|---|---|
19:00 ~ 19:10 | オープニング | アンケート集計結果の共有など |
19:10 ~ 20:10 | メイン | 今回のイベント内容 |
20:10 ~ 20:20 | クロージング | Q&Aなど |
- 途中、入退出していただいても問題ありません。
- 当日の状況によって順番や終了時間が多少変動する可能性もあります。
YouTube Live 配信URL
今回のイベントはYouTubeを視聴するだけで学べるライトなスタイルです。
- 本イベント申し込み済の方は本ページ上部の「参加者への情報」にYouTubeLiveの配信URLが表示されます。
- 本イベントに申し込みされた方のみが視聴できるYouTubeLive限定公開URLです。
- アーカイブが残りますので、お申込みした方は後日閲覧することが可能です。
- YouTubeで一般公開するかは未定です。リアルタイムに参加できない方もお申込みください。
運営・お問い合わせ
JellyWare株式会社
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。