TECH PLAY

大規模言語モデル(LLM)」に関連する技術ブログ

1196 件中 511 - 525 件目
みなさん、こんにちは。ソリューションアーキテクトの榎本です。OpenSearch Magazine の第 1 号をお届けいたします。本号では OpenSearch Service の最近のアップデート情報と、OpenSearch 最適化インスタンスタイプのご紹介、OpenSearch Project で現在開発が進められている OSS 版 OpenSearch 3.x 系のロードマップアイテムについてお話いたします。 OpenSearch Magazine は、 Amazon OpenSearch Ser
この記事は 「 Five Critical Technology Trends for Retailers in 2025 」(記事公開日: 2025 年 3 月 5 日)の翻訳記事です。 NRF Big Show で賑やかなベンダーのブースをくまなく訪ねてみると、そうした展示に共通して認められるトレンドに気づかずにはいられませんでした。つまり、こうしたテクノロジーによって今後数か月から数年で業界は再編成されると予想されます。トピックとしては必ずしも新しいものではありませんが、一般的なユースケースに対処す
こんにちは、Amazon Connect ソリューションアーキテクトの坂田です。みなさん、お花見はもう行かれましたか?東京ではあちこちで満開の桜を楽しむことができて、私は大好きな季節です。 さて、今月も Amazon Connect に関する重要なお知らせがたくさんで、まさに満開の様相です!皆さんのお役に立つ内容があれば幸いです。 注目のアップデートについて 2025年3月のアップデート一覧 AWS Contact Center Blog のご紹介 1. 注目のアップデートについて #1: 強力な AI
G-gen の佐々木です。当記事では Google Cloud Next '25 で発表された Google Kubernetes Engine(GKE)における最新の生成 AI 関連機能を紹介します。 概要 GKE における AI 推論 ワークロード GKE Inference Quickstart GKE Inference Gateway GKE TPU serving stack 概要 Google Cloud の旗艦イベントである Google Cloud Next '25 にて、GKE で生成
  サイバーエージェントは、生成AIを会社の競争力とするために全社で取り組んでいます。20 ...
はじめに Amazon Bedrock は AWS が提供する生成 AI のマネージドサービスであり、複数の大規模言語モデル(LLM)や基盤モデルへのアクセスを提供します。Bedrock では LLM を利用するために 2 つの主要な API が用意されています。それが InvokeModel API と Converse API です。 本記事ではこれら 2 つの API の機能と設計上の違いと具体的なプログラムからの呼び出し例について記載します。 InvokeModel API と Converse
みなさんこんにちは! ワンキャリアのデータチームでテックリードをしている高根沢 (X: @p0x0q_jp ) です! 今回は、Gemini の安定性を継続的に監視するために導入した「ヘルスチェックエンドポイント」と「DataDog Synthetic Test による外形監視」の仕組みについてご紹介したいと思います。 最近データチームでは、 Google の Gemini を活用した開発を進めているのですが、時折レスポンスが不安定になるという課題に直面していました。 具体的には、以下のような 429 R
さとうです。 皆さんはどのようにAWSの構成図を描きますか? VisioやCacooなど作図専用のサービスは多々ありますが、個人的にはdraw.ioが好きです。 draw.ioはXMLで構造化されているのでLLMで作図してくれるのではないかと思い、タイトルの通り試してみました。 Amazon Q Developer CLIのAI Agentについて 概要 料金 インストール方法 描かせてみた 実行環境 描かせる構成 シンプルな命令で作らせてみた プロンプト アウトプット 課題 命令を具体化してリトライして
本記事は 2025 年 4 月 7 日に AWS Machine Learning Blog で公開された Effectively use prompt caching on Amazon Bedrock を翻訳したものです。翻訳はソリューションアーキテクトの川戸渉が担当しました。 Amazon Bedrock において、プロンプトキャッシュの一般提供が開始されました。Anthropic の Claude 3.5 Haiku と Claude 3.7 Sonnet に加え、 Nova Micro、 Nov
LLMOpsとは? 近年、GPT-4のような大規模言語モデル(large language model、以下LLM)の使用が普及し、それを活用したアプリケーションの開発が活発に行われています。たとえば...
ども!4月に年度が更新され、4年目のエンジニアになった龍ちゃんです。気づけば、また春の季節になっていますね。春といってもまだ寒いですね。 今回は、Azure OpenAI Serviceのお話になります。生成AIを活用したアプリを作成する際に、レスポンスがJSONで返答されるかどうかは重要な要素になります。DifyでもAOAIでも、方法を模索して実装していました。 Difyでの構造化:「 Dify入門ガイド:LLM出力を構造化する!JSONデータ作成の具体的手順 」 AOAIでの構造化:「 AOAI:Gp
AWS の生成 AI ワークロードのコスト最適化に関するシリーズの第 2 回目のブログへようこそ。 最初のブログ では、生成 AI を適用するためのさまざまな実装アプローチとクラウド財務管理の原則に関する概要を説明しました。今回は、Amazon Elastic Compute Cloud ( Amazon EC2 ) と Amazon SageMaker AI を使用し、カスタム AI モデルの構築とデプロイに関するコスト最適化戦略について詳しく説明します。大規模な言語モデルをトレーニングする場合、既存の
1. 前書き こんにちは。 前回に引き続き、ホワイトペーパー「Elasticsearchを使った簡易RAGアプリケーションの作成」に 記載した技術的要素を紹介いたします。(*脚注1 1 ) 今回は、同義語の利用です。 対象者 Elastic Cloud のアカウントをお持ちの方(トライアルライセンスを含む) Elasticsearch の初心者~中級者 できるようになること Elasticsearch に同義語の登録ができる。 Elasticsearch で同義語を考慮した検索を実行できる。 前提条件 E

ブログランキング

集計期間: 2025年12月7日 2025年12月13日

タグからブログをさがす

ソフトウェア開発

Vim情報共有ツールJestGitHub

プログラミング

C言語jQueryC++Perl

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。 情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?
無料でイベントをはじめる