株式会社AI Shift(株式会社サイバーエージェントグループ) のイベント・技術情報

技術ブログ
2024/06/27 更新
ブックマーク

議事録自動生成システムにおける音声の書き起こし機構の改善

はじめに こんにちは,東京大学大学院 修士2年の兵藤弘明です.私は2024年3月から4月にかけて,CA Tech JOBのインターンシップに参加し,株式会社AI Shift で議事録自動生成のための効果的な音声認識パイプラインの検証に取り組みました.この記事では取り組...
技術ブログ
2024/06/19 更新
ブックマーク

Audio-Mambaを使った音声分類

こんにちは、AIチームの戸田です 今回は近年Transformerの次のアーキテクチャになるのでは?と話題の状態空間モデル、Mambaを使った音声分類を試してみたいと思います。 Mamba Mambaは近年主流となっているTransformerの次のアーキテクチャとして期待されてい...
技術ブログ
2024/06/10 更新
ブックマーク

kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた

はじめに こんにちは、AIチームの大竹です。 最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をし...