2023/11/21(火)19:00 〜 20:20

AIとPythonで音声から書き起こし！OpenAIのWhisperを無料で使いこなすハンズオン

オンライン

Python, ハンズオン, Google Colab

イベント内容

お申し込み後、本ページ上部の「参加者への情報」にYouTubeLiveの配信URLが表示されます。お申込者様への限定公開でアーカイブを残しますので、リアルタイムに参加できない場合もお申込み下さい！

本イベントに参加するにあたり、インストール・ログイン・カメラ・マイクなど一切不要で、YouTubeLiveを視聴するだけでOKです。匿名で投稿できるチャットも準備しておりますので、ライブ中に気軽に質問も可能です。

概要

OpenAIのWhisperを使ってPythonで音声ファイルから書き起こしを行うハンズオンを行います。ハンズオンはこちらが準備したものを使用するため、インストール等の事前準備は不要です。

Whisperとは？

WhisperはOpenAIが提供する汎用の音声認識モデルです。多様な音声の大規模なデータセットでトレーニングされており、日本語を含む多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。MP3やWAVなどの音声ファイルの他にMP4などの動画ファイルを入力として、テキスト書き起こし可能です。

簡単なコード記述で使いこなしを学ぶ

Whisperにはtiny、base、small、medium、largeなど様々なモデルがあります。またCPUとGPUで実行速度が異なります。ローカル環境で構築する際の注意、さらに本家Whisperを超える実行速度を出す他のオープンソースの紹介など、検証しながらハンズオンを行います。

本イベントについて

プログラミング言語としてPythonを使用しますが、ハンズオンはこちらが準備したブラウザ上のColaboratoryを使います。Googleアカウントのみ用意していただければ、事前にインストールや環境設定などの準備は必要ありません。一緒に作業しても良いですし、見ているだけでもOKです。簡単なコマンドとコードのみですので、初心者の方でも問題ありません！

得られること

⚙️ Whisperの使いこなし

⚙️ Colaboratoryの使い方

⚙️ Python基礎

対象者

💡 Pythonに興味がある方

💡 AIに興味がある方

💡 オリジナルのAI書き起こしアプリを作りたい方

💡 プログラミングで業務改善や新規事業を行いたい企画・マーケティング職、営業職の方

💡 プログラミングに興味があるが、まだ始められていない学生の方

※上記以外の方でも興味があれば参加可能です！

背景

イベントを実施する背景として、こちらの「ものものテック」というサービスがあります。

「ものものテック」は、AI・IoT・ロボティクスを中心とした、オンラインで学べる技術教育サービスです。いつでもどこでもウェブブラウザで文章・画像・動画を見ながらコードを実行し自主的に学べます。本イベント内容に加え、「ものものテック」でさらに深く学んでいただければと思います。

https://monomonotech.jp

タイムテーブル

時間	内容	詳細
19:00 ～ 19:10	オープニング	アンケート集計結果の共有など
19:10 ～ 20:10	メイン	今回のイベント内容
20:10 ～ 20:20	クロージング	Q＆Aなど