株式会社AI Shift(株式会社サイバーエージェントグループ) の技術ブログ
全21件
オペレーター研修支援ボットの開発@インターンシップ
2024/11/06
ブックマーク
はじめに こんにちは!奈良先端科学技術大学院大学 修士1年の夏見昂樹です。これまで研究ばかりで開発の経験がほとんどなかったので、大学院で学んでいる自然言語処理の技術を用いた社会実装を行いたい思いから、10月2日から10月31日までの約1ヶ月間、サイバーエージェントのインターンシップ-CA Tech JOBに参加させていただきました。 この記事では、私が本インタ
Realtime APIとTwilioを用いた電話予約デモシステムの構築
2024/10/29
ブックマーク
はじめに こんにちは、AI チームの長澤 ( @sp_1999N ) です。 今回の記事では 2024/10 に OpenAI から発表された Realtime API と Twilio を用いて、音声予約デモシステムを構築してみます。 Twilio が公開しているデモコード を参考に、function calling などを用いて簡単な対話管理・予約可能日の取得(空き枠検索)を組み合わせたシステムの構築を行い、現時点でのプロダクト適用可能性
内定者が15日で話者ダイアライゼーション機能をリリースした話
2024/10/01
ブックマーク
はじめまして!東北大学修士1年の 林崎 由 ( @u_hyszk )と申します!大学では音声信号処理や自然言語処理に関する研究を行っています。 9/6〜9/30の15日間、株式会社AI Shiftで内定者アルバイトとして就業しました。テーマは「 モノラル音声での話者ダイアライゼーション 」であり、技術選定から実際のプロダクトへのリリースまで一貫してやり切ることができました。 本記
Nishika音声認識コンペに参加して2位になりました!🎉
2024/09/25
ブックマーク
はじめに こんにちは、AIチームの大竹です。 今回は弊社AIチームが Nishikaにて開催された音声認識コンペ に参加したので、その参加報告をさせていただければと思います。 弊社は AI Messenger Voicebot や AI Messenger Summary など、音声処理技術を活用したプロダクトを提供しています。しかし、弊社が持っている音声処理に関する技術力をアピールできる機会は少なく、現在のAI
Argo Workflowsで構築したMLパイプラインの監視事例
2024/09/20
ブックマーク
こんにちは。AIチームの干飯( @hosimesi11_ )です。今回はAI Shiftの新規サービスであるAI Messanger SummaryのMLパイプラインの監視についてまとめたいと思います。 具体的にはExitHandlerで外部ツールとの連携をしつつ、詳細なメトリクスの監視は Google Cloud Managed Service for Prometheus + Cloud Monitoring で構成しました。 事前情報 AI Messenger Summaryとは AI Messenger Summaryはコールセンターにおけ
YANS2024参加報告
2024/09/16
ブックマーク
はじめに こんにちは。AIチームの栗原健太郎です。 今年度開催の2024年9月4日(水)〜2024年9月6日(金)に梅田スカイビルで行われた第19回YANSシンポジウム (YANS2024) にAIチームから自分を含む4名 (栗原, 長澤, 大竹, 邊土名) が聴講参加しました (邊土名は本所属AI Lab)。 また、僕自身は今年度よりYANS委員として、微力ながら本シンポジウムの運営業務にも参画しておりました。 昨
AutoMLOpsを使って機械学習CI/CDパイプラインを組んでみた
2024/08/27
ブックマーク
はじめに こんにちは、AI チームの長澤です。 この記事では Google によって開発・提供されている AutoMLOps を使って、充実した CI/CD パイプラインを手軽に構築してみようと思います。 今回は公式によって提供されているチュートリアルの流れに沿って、どのような GCP サービスが展開・構築されるのかを実際に手を動かして試してみます。 AutoMLOps AutoMLOps は Google によって
ベイジアンA/Bにおけるサンプルサイズを見積もる
2024/07/31
ブックマーク
はじめに こんにちは,AIチームの下山です. 弊社では自動音声対話サービスVoicebotにおける施策の検証方法として,ベイジアンA/Bテストを採用しています. (ベイジアンA/Bの概要については こちらの記事 をご覧ください). 本記事では,ベイジアンA/Bにおいて,効果が高い施策の選択を間違える(例えば,AとBの比較を行い,本来はAの方がBより効果が高いのにBを選択
音声品質と音声認識精度の関係について分析してみた(Part1)
2024/07/31
ブックマーク
はじめに こんにちは、AIチームの大竹です。 現在、AI Shiftではコールセンター業務自動化を目的とした自動音声対話システム、AI Messenger Voicebotを運用しています。 今回は、音声対話システムがカスタマーの意図を理解するための入り口として最も重要な技術である音声認識にフォーカスしたいと思います。音声認識の誤りが多くなると、後段の言語処理や対話管理に悪い
議事録自動生成システムにおける音声の書き起こし機構の改善
2024/06/27
ブックマーク
はじめに こんにちは,東京大学大学院 修士2年の兵藤弘明です.私は2024年3月から4月にかけて,CA Tech JOBのインターンシップに参加し,株式会社AI Shift で議事録自動生成のための効果的な音声認識パイプラインの検証に取り組みました.この記事では取り組んだ内容を具体的に紹介します. タスクの背景 株式会社AI Shiftでは,オンライン会議の議事録を自動生成するシス
Audio-Mambaを使った音声分類
2024/06/19
ブックマーク
こんにちは、AIチームの戸田です 今回は近年Transformerの次のアーキテクチャになるのでは?と話題の状態空間モデル、Mambaを使った音声分類を試してみたいと思います。 Mamba Mambaは近年主流となっているTransformerの次のアーキテクチャとして期待されているモデルの一つです。LLMの文脈で目にすることが多いのですが、音声を扱う Audio-Mamba や、画像を扱う Vision-Mamba などの
kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた
2024/06/10
ブックマーク
はじめに こんにちは、AIチームの大竹です。 最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。 書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸
SliceGPTを使って日本語LLMをPruningしてみる
2024/06/03
ブックマーク
こんにちは AIチームの戸田です 今回はLLMを軽量化するPruningを行うライブラリ、SliceGPTを使って日本語LLMのPruningを試してみたいと思います。 SliceGPT LLMに限らず、大規模なニューラルネットワークのパラメータを圧縮する手法の一つにPruningがあります。日本語では「枝刈り」や「剪定」とも訳されており、重要ではないと思われるノード間の重みを削除することでパラメー
高効率のLLM学習手法ReFTを試してみる
2024/05/17
ブックマーク
こんにちは AIチームの戸田です 今回は先月スタンフォード大学が発表した新しいParameter-efficient fine-tuning(PEFT)のReFTを試してみたいと思います。 PEFT PEFTはLLMのような大規模な事前学習済みのニューラルネットワークのモデルを、効率的にfine-tuningする手法の総称です。モデル全体ではなく一部のパラメータだけを更新することで計算コストを大幅に削減できる上に、Full fi
Argo WorkflowsとGKEで構築するLLMを使った要約サービスの機械学習パイプライン
2024/04/26
ブックマーク
こんにちは。 AIチームの干飯( @hosimesi11_ )です。今回はAI Shiftで取り組んでいる新規サービスであるAI Messenger Summaryの機械学習パイプラインと、Proof of Concept(PoC)から実際のプロダクトへと展開する過程についてご紹介します。 AI Messenger Summaryとは AI Messenger Summary はコールセンター事業における、会話内容の要約サービスになります( プレスリリース )。コールセンターでは