TECH PLAY

大規模言語モデル(LLM)」に関連する技術ブログ

1392 件中 211 - 225 件目
こんにちは、サイオステクノロジーの遠藤です。本ブログはSIOS Tech Labアドベントカレンダー18日目の投稿です。 今回は、RAG評価フレームワークである Ragas の最新バージョン v0.4.0 について紹介します。 さらに、GPT-5の reasoning_effort パラメータを使って、 minimal(高速モード)とhigh(推論重視モード) での評価結果の違いも検証しました。 Ragasのv0.4.0で何が変わったの? Azure OpenAI ServiceのGPT-5でRagasを
こんにちは。 ファインディ株式会社でテックリードマネージャーをやらせてもらっている戸田です。 現在のソフトウェア開発の世界は、生成AIの登場により大きな転換点を迎えています。 GitHub CopilotやClaude Codeなど、生成AIを活用した開発支援ツールが次々と登場し、日常的なワークフローに組み込まれつつあります。 そんな中で先日、弊社主催でAI Engineering Summit Tokyo 2025が開催され、「Findy AI+の開発、運用におけるMCP活用事例」と題しまして登壇してき
こんにちは、MEKIKI X AIハッカソンもくもく勉強会の17日目を担当する株式会社NTTデータグループ 技術革新統括本部 AI技術部の王と申します。 今回は、スペイン・バルセロナで開催された AGENTIC AI Europe 2025(2025年12月4〜5日)に参加した内容をレポートします。 2日間という限られた時間でしたが、多くの専門家による講演やディスカッションから得られた学びは非常に大きく、参加価値が十分にありました。 イベント情報 目的とテーマ このイベントは、欧州における 企業向け生成A
はじめに Claude Code を使っていて、こんな経験はありませんか? Claude Code が編集したファイルのフォーマットがチームのルールと違う センシティブな .env ファイルを誤って編集してしまった 実行されたコマンドを後から確認したいが、履歴が残っていない Claude Code が入力待ちになっていることに気づかず、時間を無駄にした これらの課題を解決するのが Hooks 機能 です。 Hooks は Claude Code のライフサイクルの様々なタイミングで、ユーザーが定義したシェ
この記事は Safie Engineers' Blog! Advent Calendar 17日目の記事です。 はじめに セーフィー株式会社 AI開発部でテックリードを務める橋本です。 本記事では、私が2025年の1年間を通じて 設計・実施してきたAI開発部の技術ミーティングの取り組みについてご紹介します。 これらのミーティングは、テックリードとして掲げた 「継続的な学びと成長の機会を提供し、組織全体の技術力を底上げする」 という目的のもと企画しました。 具体的には、以下の4つの活動を軸として運用していま
サーバーワークスの村上です。 このブログでは、AWS re:Invent 2025 で発表された Amazon Bedrock の Reinforcement Fine-tuning(RFT)について紹介します。 前提(時間がない方は読み飛ばしてください) LLMの一般的な学習プロセス 事前学習(Pre-training) 教師ありファインチューニング(SFT / Supervised Fine-Tuning) フィードバックにもとづく強化学習(RFT) RFTが注目される背景 PPO(Proximal
はじめに こんにちは、2025年5月に中途入社したデータエンジニアの蛭田海斗です。普段はMagic: The Gatheringを
この記事は、NTTデータ Snowflakeアドベントカレンダーの16日目です。 1. はじめに 生成AIを活用したアプリケーション、特に RAG(Retrieval-Augmented Generation)ベースのチャットボットを運用していくうえで、「回答の品質を継続的に評価すること」 は欠かせません。 RAG の品質評価には大きく分けて次の2つがあります。 人手による評価(Human Evaluation): 人が実際の回答を読み、正確性や有用性を判断する LLM による評価(LLM-as-a-Ju
はじめに さくらのVPS には、LLM(大規模言語モデル) を操作するための AI プラットフォームである Open WebUI を構築できるさくらインターネット公式スクリプトがあります。今回は、そのスクリプトを使って […]
はじめに クラウドエース株式会社 第二開発部の菅野です。 Cursor を使用していると、エージェントの入力欄に「Connect to Browser」という機能を発見しました。この機能は 2025 年 9 月末にバージョン 1.7 で追加され、2025 年 10 月末のバージョン 2.0 で正式版としてリリースされた比較的新しい機能です。まだ使用したことがなかったため、Cursor に質問しながら実際に試してみました。 本記事では、Connect to Browser 機能の概要から実際の使用例、そして
本記事は TechHarmony Advent Calendar 2025 12/16付の記事です 。 こんにちは。SCSKの さと です。 2025年のre:Inventは何が印象に残ったでしょうか。DevOps Agent?新しいSecurity Hub?あるいはDr. Werner Vogelsの最後のKeynoteでしょうか。 さて、今回はre:Inventで発表された自動推論チェックについてご紹介します。とはいっても2024年のre:Inventです。本機能は長らくプレビュー状態で申請をしないと
本記事は【 Advent Calendar 2025 】の13日目の記事です。 Autogen とは? Autogenは、AIを活用したマルチエージェントシステム構築のためのフレームワークです。 簡単に言うと AIエージェントを相互に会話させ、協働させ、タスクを自動的に解決させることができます。 1つのAIがすべてを行う代わりに、複数の専門化されたエージェントが存在します。 これらのエージェントは、複雑なワークフローを完了するために通信し、情報を共有し、協力して作業できます。 特徴 LLM統合 :GPTな
本ブログは 2025 年 11 月 10 日に公開された AWS Public Sector ブログ「 Accelerating CMMC readiness: How AWS and Wiz help public sector organizations 」を翻訳したものです。 米国政府のコントラクターおよびサブコントラクターにとって、 Cybersecurity Maturity Model Certification (CMMC) の取得は片手間にこなせる仕事ではありません。この認証の取得にはリス
こんにちは、ココナラで Web エンジニアをしている慕狼ゆに (しのがみゆに) (@yuni_shinogami) です。 こちらは株式会社ココナラ Advent Calendar 2025 15 日目の記事です。 普段は業務で TypeScript を書いていますが、今回は技術的な How-to ではなく、「あえて Haskell に入門してみた」という個人の学習記録を書きたいと思います。 「なぜ今さら Haskell?」と思われるかもしれませんが、普段 TypeScript を書いている人間が、Has
Android Chapter の tick-taku です。 この記事は Timee Product Advent Calendar 2025 の15日目の記事です。 はじめに 2025年は AI コーディング・AI エージェント元年であり黎明期の渦中 と言っても過言ではない年だったと感じます。 各社からこぞって AI エージェントがリリースされ、その後も息つく暇もなくアップデートされてきました。単純なコード補完ではなくタスクを任せられるようになった昨今の AI エージェントは今ではすっかりコーディング