株式会社AI Shift(株式会社サイバーエージェントグループ) の技術ブログ

2種類のS3バケットをナレッジDBとして活用する

こんにちは、AIチームの干飯( @hosimesi11_ )です。 この記事は AI Shift Advent Calendar 17日目の記事になります。今回は、ナレッジDBとして使用して2種類のS3バケットを使用し、高コスパなチャットシステムを作成しました。本記事で扱ったコードは こちら で公開しています。 はじめに 生成AIのプロダクトへの組み込みが増えるにつれて、検索システムの重要性も高まっています

Langfuse セルフホストでハマったポイントをまとめてみる

こんにちは、AI チームの長澤 ( @sp_1999N ) です。 この記事は AI Shift Advent Calendar 2025 の16日目の記事です。 弊社サービスの AI Worker Platform では AI エージェントの監視基盤として Langfuse を採用しています。 Langfuse をはじめとしたエージェント監視基盤については、 こちらの記事 でまとめておりますので、よければご覧ください。 さて、この記事では Langfuse を (GKE で Helm depend

1年振りに最新のSpeechLLMで音声データからのエンティティ抽出の検証

こんにちは、AIチームの杉山です。 本記事は AI Shift Advent Calendar 2025 15日目の記事です。 昨年のAdvent Calendarでは、 OpenAI gpt-4o-audioを用いた音声データからのエンティティ抽出の検証 という記事を執筆しました。 当時はまだ gpt-4o-audio-preview というプレビュー版のみでの検証でしたが、音声認識(ASR)を介さずに直接音声からエンティティ(ex. 店舗予約に必要な店舗名や商品

オペレーターの「暗黙知」をLLMで言語化する: 「SPUR」を用いた応対品質ルーブリックの自動構築

こんにちは、AI Shiftの東( @naist_usamarer )です。 この記事は AI Shift Advent Calendar 2025 の12日目の記事です。 今回の記事では、ユーザー満足度測定のための評価項目(ルーブリック)をLLMによって自動構築する手法「SPUR」を紹介し、その手法を拡張してオペレーター応対の評価項目の言語化を試みました。 論文紹介: Interpretable User Satisfaction Estimation for Conversational Systems with Large La

Agent Development Kit の Visual Builderを試して、プロンプトから設計の要点を学ぶ

こんにちは、AIチームの二宮です。 本記事は AI Shift Advent Calendar 2025 11日目の記事です。 今回の記事では、Agent Development Kit(ADK)のVisual Builderを実際に試してみました。このツールを用いたエージェントの構築を通じて、Visual Builderのプロンプトから学べることをまとめてみます。 Agent Development Kit(ADK)とは ADKは、Googleによって開発されたオープンソースのエージェント構

音声対話AIの性能をどう測る?Realtime API評価ベンチマークの解説と日本語での検証

こんにちは、AIチームの大竹です。 この記事は AI Shift Advent Calendar 2025の8日目の記事です。 2024年10月、OpenAIが発表した Realtime API は、音声入出力をリアルタイムで処理できるAPIとして大きな注目を集めました。音声から音声への一気通貫した処理(Speech-to-Speech)が可能になることで、ボイスボットや音声対話AIアシスタントの可能性が一気に広がったのは記憶に新しいとこ

企業向けスライド生成AIエージェントをPythonとGPT5で作ってみた

こんにちは、AI Shift AI Solution事業部 Forward Deployed Engineer(FDE)の若泉です。 この記事は AI Shift Advent Calendar 2025 の6日目の記事です。 はじめに ここ最近、資料作成AIが次々と登場しています。 「文章入れたら、もうスライドになる」が当たり前になりつつある一方で、提案資料を作る側としてはこう思うこともあります。 テンプレはウチの会社のやつ使いたい 提案資料には“

Ouroの中間ステップをデコードしてみる

こんにちは AIチームの戸田です この記事は AI Shift Advent Calendar 2025 の5日目の記事です。 今回はByteDanceの出した新しいLLMアーキテクチャ、 Ouro の中間ステップをデコードしてみたいと思います。 Ouro https://huggingface.co/ByteDance/Ouro-1.4B OuroはReasoning、つまり思考部分をモデル内部のループ構造で行ってしまおう、という試みから生まれたモデルです。 従来のLLMでは、このReasoning

【社内実践】「AI Crazy Shift」で組織はどう変わったか? PM業務30%削減の舞台裏とカルチャー変革

こんにちは、AI Shiftの鉢呂です。 この記事は AI Shift Advent Calendar 2025 の3日目の記事です。 弊社は約2年間、生成AIの急速な進化とともに新たな働き方を模索し続けてきました。そして今年、グローバルAIカンパニーとして本格的にAIエージェント領域へ参入し、ミッションとバリューを刷新しました。 「人とAIの協働を実現し、人類に生産性革命を起こす」 これが私たちの新

生成AI推進者が持つべき3つの心構え

こんにちは、AI Shift AIエージェント事業部 チーフエバンジェリストの及川( @cyber_oikawa )です。 この記事は AI Shift Advent Calendar 2025 の2日目の記事です。 AI Shiftの生成AIリスキリング事業がスタートしてから約2年弱、様々な企業での生成AIを社内推進の事例をご支援させていただきました。 その中で、社内推進が進んでいる企業と進んでいない企業にはどんな差があるのかが見

Post-hoc Rationalization: LLMの推論は「言い訳」か?

こんにちは AIチームの戸田です 以前、本TechBlogでDeepSeek-R1などの推論モデルで見られる「aha moment(アハ体験)」について紹介しました※。モデルが思考しているかのように振る舞う様子は非常に興味深い一方で、「これは本当に考えているのか? それとも人間がそう言う確率が高いから模倣しているだけなのか?」という疑問も残りました。 今回はその疑問から派生して

データ合成から利用まで: Autonomous AI Database だけでどこまでできるかやってみた

はじめに こんにちは、AIチームの長澤 ( @sp_1999N ) です。 この記事では Autonomous AI Database (ADB) で提供されている機能を色々触ってみようと思います。 こちらは Oracle 社によって開発・提供されており、プロビジョニングやアップグレード、リカバリ、チューニングなどフルマネージドに管理してくれるデータベースです。 データベースとしての性能が高いのはもちろんです

TypeScript版DSPy、axを試してみた

こんにちは AIチームの戸田です LLMを使ったアプリケーション開発において、Prompt Engineeringは避けては通れません。しかしタスクやドメインによって最適なPromptは異なりますし、ほんの一文追加しただけで出力が大きく変わってしまうなど、試行錯誤にかかるコストが課題になってきます。 そこで最近Promptを自動的に最適化するツールが注目されています。有名なものだと

Oracle AI World 2025 参加レポート

はじめに こんにちは、AIチームの長澤 ( @sp_1999N ) です。 この度 Oracle AI World 2025 にスポンサーとして参加してきました。 本ブログでは Oracle AI World (OAW) の概要とともに各種トピックスをご紹介できればと思います。 Partner Award 受賞 OAW やセッションのご紹介の前に、この度弊社 AI Shift がグローバルに受賞頂けたので、そちらの紹介からさせてください。 Oracle はさまざまな

LLM-as-a-Judgeにまつわるバイアスまとめ

はじめに こんにちは。AIチームの村田(X: @em_portero )です。 AI Shiftでは、生成AIリスキリング事業にてチーフエバンジェリストとして企業での生成AI活用を支援するリスキリング研修講師を担当及川(X: @cyber_oikawa )とAIチームで、AI技術の進化をストーリーとして読み解くAI教養ポッドキャスト「AI Shift Academy」を運営しています。 私も台本のためのサーベイに携わっており