TECH PLAY

大規模言語モデル(LLM)」に関連する技術ブログ

1110 件中 391 - 405 件目
AIエージェントの定義。2025年の最重要AI用語の概念を整理 2025.4.23 株式会社Laboro.AI リード機械学習エンジニア 川崎奏宜 概 要 2022年11 月にChatGPTが登場して以降、多くの企業でLLM(Large Language Model、大規模言語モデル)の活用が急速に広がりました。2023年以降はRAG(Retrieval-Augmented Generation、検索に基づく回答生成)やマルチモーダルLLMといった技術が急速に発展しました。そして2025年はAIエージェン
はじめに こんにちは、データエンジニアをしているMaruです。 近年、データ基盤と統合したAIエージェント開発のプラットフォームとしてDatabricksが注目を集めています。DatabricksはAIエージェントの開発および運用を効率化するために多くの機能を提供しており、その一つにAIエージェントの性能を評価するMosaic AI Agent Evaluationがあります。 本記事では、その中でもLLMを利用した精度評価機能LLM-as-a-Judgeに焦点を当て、日本語環境でどの程度活用できるかを検
みなさんこんにちは!ワンキャリアのデータサイエンティスト兼マーケターの長谷川です。(GitHub:@tyuyoshi) 今回は、OpenAIの GPT-4.5 とAnthropicの Claude 3.7 Sonnet について、実際の使用体験をもとに比較していきたいと思います。どちらも2025年前半におけるAI最先端モデルとして注目を集めていますが、それぞれに特徴があり、用途によって使い分けると効果的です。今回は処理速度、ファイル処理能力、そして画像理解力の3つの側面から、実践的に検証してみました!
はじめに こんにちは。クラウドエース第三開発部の泉澤です。以前はデータソリューション系の開発部に所属し、現在は生成AI を活用したサービス開発に取り組んでいます。 LLM アプリの自動評価手法として、LLM に評価を実施させる LLM‐as‐a‐Judge が注目されています。しかし、その自動評価結果がどの程度信頼できるのか、またどのように改善していけばよいのかを検証するのは容易ではありません。 そこで、本記事では、Langfuse を活用して以下のプロセスを実践する方法を考え、実際に LLM に生成(翻
1. Introduction Hello, this is Torii ( @yu_torii ) from the Common Service Development Group. I'm a fullstack software engineer, primarily working on both backend and frontend development. As part of the KINTO Member Platform Development Team, I focus
1. Introduction Hello, this is Torii ( @yu_torii ) from the Common Service Development Group. I'm a fullstack software engineer, primarily working on both backend and frontend development. As part of the KINTO Member Platform Development Team, I focus
みなさん、こんにちは。ソリューションアーキテクトの根本です。 今週も 週刊AWS をお届けします。 気温が乱高下していますが皆さん対象崩されてないでしょうか?私は花粉症が落ち着いたと思ったら、この寒暖差に若干やられています・・・。皆さんも起きをつけください。 さて、アップデートの前に少しイベントの紹介をさせてください。 今週ですが2025/4/24(水)に「 AWS で実現する VMware 仮想環境からの移行戦略 」が開催されます。仮想環境の運用にお困りの方や、移行をお考えの方は是非ご参加ください! も
みなさん、こんにちは。AWS ソリューションアーキテクトの野間です。4月16日にAWS ジャパンでは生成 AI 実用化推進プログラムを発表させていただきました。“ジャパンでは“と記載しているのは、日本独自のプログラムだからです。2023年の大規模言語モデル(LLM)開発支援プログラムを発展させ、2024年7月に本格始動したこのプログラムでは、すでに150社以上の組織が参加し、実践的な生成AI活用を支援しています。単なる技術支援にとどまらず、定期的な勉強会の開催や事例共有を通じて、業界横断的な開発者コミュニ
はじめまして!Data Scientistの市川です。 今回は、先日第34回 人工知能学会 金融情報学研究会(SIG-FIN) に行ってきましたので、そのレポートをさせて頂ければと思います。 イベントの概要 発表の概要 SIG-FIN UFO-2024 タスク(6件) (01) 有価証券報告書の表を対象としたUFO-2024コンペティション (02) 表構造の理解と表項目の説明文生成に基づくTable QAタスクへの挑戦 (03) 有価証券報告書の表質問応答を対象としたSIG-FIN UFO-2024タス
はじめに 世の中では MCP に関する話題で盛り上がっています。ここではちょっとだけ過去に戻り、Retrieval Augmented Generation (RAG) の基本と、AWS における実装例についてまとめます。こちらのブログでも言及されていることに関連して、MCP は LLM にとって多様な データソース に対する繋ぎこみの規格を定め、それをツールとして使用することで単なるチャット AI ではなく、AI エージェントとして振舞えるよう(振舞いやすくするよう)にするための仕組みです。 今回まとめ
AIエージェントは、これからの社会に大きな変革をもたらす可能性を秘めた技術です。本セッションでは、A ...
はじめに AI と外部システムの連携を標準化する Model Context Protocol (MCP) が、2024 年後半に Anthropic 社から発表されて以来 [1]、界隈では大きな注目を集めています。AI が様々なツールやリソースへ簡単にアクセスできるようになる「AI のための USB-C」というコンセプトは非常に魅力的です。実際に MCP に対応する Cursor や Zed といった開発ツールやさまざまな MCP サーバーなどが登場したことでエコシステムは着実に広がり、盛り上がりを見せ
こんにちは!SCSKの八巻です。 Google Cloud にて利用できる『Google Agentspace』についてご存知でしょうか?? Agentspaceを利用することで、 組織全体のコンテンツを連携させ、根拠に基づいたパーソナライズされた回答を生成する。 ワークフローアクションと連携してタスクを実行することで、従業員が必要な情報を適切なタイミングで入手する。 ことが可能となります。 Google Cloud 公式サイト: Google Agentspace | Google Cloud Goog
こんにちは、 AIチームの戸田です 今回は先日LangChainから発表された LangGraph CodeAct を E2B の仮想環境で動かしてみようと思います。CodeActは最近注目を集めているAI AgentのTool連携における新しいパラダイムで、Function Callingのような従来のツール使用方法とは一風変わった手法です。本記事ではCodeActを安全に実行するための方法と、その可能性について紹介します。 CodeActとは CodeActは、AI AgentがToolを利用する際の