株式会社AI Shift(株式会社サイバーエージェントグループ) の技術ブログ
全66件
LLMエージェントオブサーバビリティ基盤についてまとめてみた
2025/07/29
ブックマーク
はじめに こんにちは、AI チームの長澤 ( @sp_1999N ) です。 弊社では AI Worker という LLM エージェント構築プラットフォームを提供しています。 LLM エージェントを運用していると重要な要素になるのが「可観測性 = Observability」になります。 複雑な推論や複数のアクションを前提とした LLM エージェントでは、その挙動をいかに監視するかが運用上重要なトピックになります
AI Agentが回答に困った時にSlackで人間に助言を求められるMCPを検証した
2025/07/02
ブックマーク
こんにちは AIチームの戸田です 今回は、AI Agentが自身で解決できない問題に直面した際に、Slackを通じて人間に助言を求めることができるMCP(Model Context Protocol)、 AskOnSlackMCP をつくったので、架空のカスタマーサポートのデモを交えて紹介したいと思います。 https://github.com/trtd56/AskOnSlackMCP Human-in-the-loop 近年、AI Agentの能力が向上し、コーディングや業務効率化など多くの
拡散言語モデルの推論過程を眺めてみる
2025/06/02
ブックマーク
こんにちはAIチームの戸田です。 今回は Gemini Diffusion の登場をきっかけに最近話題になった拡散言語モデルの推論過程に興味を持ち、その一例として拡散言語モデルのLLaDAの推論を実際に手元で確認してみた結果を共有したいと思います。 拡散言語モデルに関しては、以前 Inception LabsのMercury Coderに関する記事 も書かせていただきましたので、こちらも合わせて見ていただ
E2E音声対話API・構築プラットフォーム最新動向の調査と自律型音声対話システムの展望
2025/05/30
ブックマーク
はじめに こんにちは、AIチームの大竹です。 近年、音声対話アプリケーションの進化が目覚ましく、顧客対応の自動化や業務効率化への期待が高まっています。弊社の AI Messenger Voicebot も例外ではなく、最先端の生成AI技術を活用した自然な対話基盤を構築し、お客様の電話応対業務のDXを推進すべく日々進化を続けています。 しかし、依然としてシナリオ(ワークフロー
LLMの推論における “aha moment” について調べてみた
2025/05/16
ブックマーク
こんにちは AIチームの戸田です 先日、LLMの "aha moment" に関して興味を持ち、関連論文やWeb上の記事を読んでみたところ、賛否両論の様々な見解があり興味深かったので、今回はその内容を共有したいと思います。 aha momentとは そもそもaha momentとは、ドイツの心理学者のカール・ビューラーが提唱した心理学上の概念で、今まで分からなかったことや、問題の答えが、突然
Inception Labsの拡散言語モデルを試してみた
2025/05/01
ブックマーク
こんにちは、 AIチームの戸田です。 本記事では Inception Labs のMercury APIのベータ版が使えるようになったので、簡単に試してみました。 ドキュメントは こちら で確認できます。 拡散言語モデル 現在のほとんどの大規模言語モデル(LLM)は「自己回帰モデル」と呼ばれ、一方向に一単語ずつテキストを生成します。 前のトークンがすべて生成されないと次のトークンを生
LangGraph CodeActをE2Bの安全な仮想環境で動かす
2025/04/17
ブックマーク
こんにちは、 AIチームの戸田です 今回は先日LangChainから発表された LangGraph CodeAct を E2B の仮想環境で動かしてみようと思います。CodeActは最近注目を集めているAI AgentのTool連携における新しいパラダイムで、Function Callingのような従来のツール使用方法とは一風変わった手法です。本記事ではCodeActを安全に実行するための方法と、その可能性について紹介します。 CodeActと
FastRTCを使って爆速でVoicebotを構築する
2025/04/16
ブックマーク
こんにちは、 AIチームの戸田です 今回はPythonでリアルタイムなAIアプリケーションを作る際に役立つライブラリ、 FastRTC を使って簡単なVoicebotを構築してみたいと思います。 FastRTC https://fastrtc.org/ FastRTCは、Pythonでリアルタイムの音声およびビデオストリーミングアプリケーションを構築するためのライブラリです。 VoicebotのようなリアルタイムなAIアプリケーションを作る
ICASSP2025 発表報告 @Hyderabad, India
2025/04/15
ブックマーク
はじめに こんにちは、AIチームの大竹です。 2025年4月6日(日)〜4月11日(金)にインド・ハイデラバード、 Hyderabad International Convention Centre にて開催された、音響・音声・信号処理分野における世界最大の国際会議である 第50回 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2025) に同じくAIチームの長澤とともに参加し、弊社から1件の研究発表を行いました。 今
Arize Phoenix で実現する LLM アプリケーションのトレース
2025/03/25
ブックマーク
こんにちは、AI チームの長澤( @sp_1999N )です。 今回は Arize AI 社が開発・提供する LLM アプリケーション向けの監視ツール Phoenix の紹介および簡単なデモ構築を行いたいと思います。 Phoenix icon デモとして Chainlit で構築した簡易的なチャットサービスを、自前ホストした Phoenix サーバーで監視してみたいと思います。 Phoenix について Phoenix は LLM アプリケーション向けの監視
LLMで挑むTitanic生存予測: Few-Shot Leaningで表形式データはどこま解ける?
2025/03/18
ブックマーク
こんにちは、AIチームの戸田です。 KaggleのTitanicデータセットは、機械学習の入門として定番のデータセットです。 Titanic - Machine Learning from Disaster 多くの機械学習手法が試されてきたこのデータセットに対し、今回は少し異なるアプローチを試みたいと思います。ランダムフォレストのような従来の表形式データ向け機械学習手法ではなく、テキストを処理するLLM(Large Lang
言語処理学会第31回年次大会(NLP2025) 発表報告
2025/03/14
ブックマーク
1. はじめに こんにちは。AIチームの栗原です。 2025年3月10日(月)〜3月14日(金)に 出島メッセ長崎 にて行われた 言語処理学会第31回年次大会 で、弊社からポスター発表で3件、口頭発表で1件の発表を行いました。 昨今の発表件数の増加の流れはさらに続いており、投稿件数は777件(昨年は599件)と過去最高をさらに記録した模様です。自然言語処理への熱はとどまるところ
言語処理学会第31回年次大会(NLP2025) でAI Shiftから4件の発表を行います
2025/03/07
ブックマーク
こんにちはAI Shiftの栗原です。3月10日(月)から3月14日(金)に 出島メッセ長崎 で 言語処理学会年次大会(NLP2025) が実施されます。AI Shiftからは口頭発表1件とポスター発表3件の合計4件の発表を行います。(口頭発表1件、ポスター発表1件は東北大NLPグループとの共同研究。)栗原の発表については、社内のゼミ制度による組織横断活動の成果発表になります。 本記事では各発
E2B Desktop Sandbox: GUI操作Agentのための安全な仮想環境
2025/02/19
ブックマーク
こんにちは!AIチームの戸田です。 近年、様々な作業の自動化を目的としたAI Agent(以下、Agent)が注目を集めています。特に、GUIを操作するAgentは、ユーザーインターフェースを介したタスクの自動化を可能にするため、大きな可能性を秘めています。 AnthropicのClaude 3.5 Computer Use や OpenAIのOperator 、オープンソースは browser-use などがその代表例です。研究分野でも、学習
Hugging Faceの新しいAgent Framework「smolagents」とCodeAgentの活用法
2025/01/24
ブックマーク
こんにちは AIチームの戸田です 今回はHugging Faceが提供しているAgent Frameworkの smolagents が非常に興味深かったので、実際に触ってみた内容を共有します。 smolagentsは、Agentをシンプルに構築できることを目的としたライブラリで、従来のAgent Frameworkと比較して以下の2点で差別化されています。 シンプルな設計: 必要最小限の抽象化でAgentの構築が可能。公式のコードも約1,000
