TECH PLAY

AWS

AWS の技術ブログ

å…š3124ä»¶

本蚘事は、2025 幎 4 月 1 日に公開された Enhance your analytics embedding experience with generative BI capabilities を翻蚳したものです。翻蚳は Solutions Architect の 守田 が担圓したした。 Amazon QuickSight は、AWS の AI を搭茉したビゞネスむンテリゞェンス (BI) サヌビスで、お客様がより迅速にむンサむトを埗お、より良い意思決定を行うこずを支揎したす。QuickSight の埋め蟌みを䜿甚するず、カスタマむズされたむンタラクティブなビゞュアルずダッシュボヌドを䜿甚しお、あらゆるアプリケヌションに有益な分析機胜を簡単に远加でき、むンフラストラクチャを管理する必芁なく、䜎コストで数十䞇人のナヌザヌたでスケヌルできたす。 Amazon Q in QuickSight は、ビゞネスむンテリゞェンスに生成 AI を導入し、埓業員がデヌタずやり取りする方法を倉革したす。具䜓的には、AI を掻甚した゚グれクティブサマリヌ、カスタマむズ可胜なデヌタストヌリヌ、耇数のビゞュアルを甚いお回答するデヌタ Q&A ゚クスペリ゚ンス、専門的なスキルを必芁ずしない高床なデヌタ分析のためのシナリオ機胜ずいった自然蚀語で利甚可胜な機胜を提䟛したす。 2024 幎 4 月に Amazon Q in QuickSight の䞀般提䟛を発衚し、開発者がデヌタ Q&A ゚クスペリ゚ンスをアプリケヌションにシヌムレスに埋め蟌むこずが可胜になりたした。しかしお客様からは、他の高床な Amazon Q in Quicksight 機胜に぀いおもアプリケヌションやりェブサむトに埋め蟌みたいずいうニヌズをいただいおいたした。 本日、お客様が GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API を䜿甚しお、アプリケヌションやりェブサむト内の QuickSight に Amazon Q の高床な生成 AI 機胜を埋め蟌めるようになったこずを発衚できるこずを嬉しく思いたす。このロヌンチにより、お客様は以䞋のものを埋め蟌むこずができたす ダッシュボヌド埋め蟌みずコン゜ヌル埋め蟌みにおける、 ゚グれクティブサマリヌ (Author Pro および Reader Pro 向け) コン゜ヌル埋め蟌みにおける、デヌタストヌリヌ (Author Pro および Reader Pro 向け) コン゜ヌル埋め蟌みにおける、Generative BI ベヌスのオヌサリングず QuickSight のトピック管理 (Author Pro 向け) コン゜ヌル埋め蟌みにおける、Generative Q&A ゚クスペリ゚ンス この投皿では、ナヌスケヌスの䟋を甚いおこれらの新機胜を有効にする方法をご玹介したす。 ゜リュヌションの抂芁 Generative BI 機胜の埋め蟌みを有効にするには、 GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API を䜿甚する必芁がありたす。たたこれらの機胜をコン゜ヌル埋め蟌みずダッシュボヌド埋め蟌みでナヌザヌに衚瀺するには、QuickSight Embedding SDK バヌゞョン 2.10 以降を䜿甚する必芁がありたす。 コン゜ヌルの埋め蟌み GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API にお、コン゜ヌル埋め蟌み甚のオプションパラメヌタである ExperienceConfiguration を䜿甚しお Generative BI 機胜を有効にするこずができたす。蚭定が指定されない堎合、これらの機胜はデフォルトでは無効になっおいたす。 ExperienceConfiguration: { QuickSightConsole: { InitialPath: " <initial path> ", FeatureConfigurations: { AmazonQInQuickSight: { GenerativeAuthoring: { Enabled: true }, ExecutiveSummary: { Enabled: true }, DataStories: { Enabled: true }, DataQnA: { Enabled: true } } } } } } これらの機胜をクラむアント偎で有効にするには、コン゜ヌル埋め蟌み甚の QuickSight Embedding JavaScript SDK の contentOptions 内のツヌルバヌオプションで以䞋を指定したす。 false に蚭定するず、゚グれクティブサマリヌ、デヌタ Q&A、ビゞュアル䜜成ぞのアクセスが非衚瀺になりたす。QuickSight Embedding JavaScript SDK の関数を䜿甚しお、カスタムされた UI からフロヌをトリガヌできたす。 const contentOptions = { toolbarOptions: { executiveSummary: true, dataQnA: true, buildVisual: true } }; ダッシュボヌドの埋め蟌み GenerateEmbedUrlForRegisteredUser API のダッシュボヌド埋め蟌み甚のオプションパラメヌタである ExperienceConfiguration を䜿甚するこずで、Author Pro たたは Reader Pro ロヌルを持぀ナヌザヌに察しお゚グれクティブサマリヌを有効にできたす。 ExperienceConfiguration: { Dashboard: { InitialDashboardId: <dashboard_id> , FeatureConfigurations: { AmazonQInQuickSight: { ExecutiveSummary: { Enabled: true } } } } } } クラむアント偎で゚グれクティブサマリヌを有効にするには、QuickSight Embedding JavaScript SDK のダッシュボヌド埋め蟌みにおいお、 contentOptions のツヌルバヌオプションで以䞋を指定したす。 false に蚭定するず、゚グれクティブサマリヌぞのアクセスは非衚瀺になりたす。QuickSight Embedding JavaScript SDK の関数を䜿甚しお、カスタムされた UI からフロヌをトリガヌするこずができたす。 const contentOptions = { toolbarOptions: { executiveSummary: true } }; ナヌスケヌス䟋 AnyCompany, Inc. は、さたざたな地域で事業を展開し、゚ンタヌプラむズ、スタヌトアップ、䞭小䌁業 (SMB) などのあらゆる業界セグメントに顧客を持぀架空の独立系゜フトりェアベンダヌ (ISV) です。これらの様々な顧客の数千人のナヌザヌが AnyCompany のアプリケヌションポヌタルにアクセスしおおり、AnyCompany は自瀟補品に差別化された䟡倀を付加するため、顧客に Generative BI 機胜を提䟛したいず考えおいたす。以䞋のようなナヌスケヌスを実珟したいず考えおいたす 耇数のビゞュアルを甚いお回答するデヌタ Q&A の有効化 より迅速なダッシュボヌドの構築 ゚グれクティブサマリヌによる迅速なむンサむト取埗 説埗力のあるストヌリヌの䜜成 耇数のビゞュアルを甚いお回答するデヌタ Q&A の有効化 AnyCompany は、埋め蟌みコン゜ヌルずダッシュボヌドの䞡方でデヌタ Q&A を顧客に提䟛したいず考えおいたす。デヌタ Q&A は、AI が生成した質問を提案し、デヌタのプレビュヌを提䟛するこずで、デヌタの内容を玠早く理解し、質問の衚珟方法や特定のトピックからどのような回答が埗られるかを把握するのに圹立ちたす。回答には、関連デヌタを瀺す耇数のビゞュアルが含たれおおり、デヌタに察する信頌性ず理解を深めるための远加のコンテキストを提䟛したす。「最も優れた補品は䜕か」ずいった挠然ずした質問や、単䞀の顧客や補品名ずいったシンプルな単䞀倀のク゚リでも、Amazon Q は質問に関連するデヌタを芋぀け出し、リク゚ストに䞀臎する耇数のデヌタがある堎合は代替案も提瀺したす。 QuickSight のコン゜ヌルで、 GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API の Experience Configuration パラメヌタで DataQnA を有効にしたす。たた、QuickSight Embedding JavaScript SDK 内の contentOptions 配䞋のツヌルバヌオプションで dataQnA を true に蚭定したす。 より迅速なダッシュボヌドの構築 AnyCompany は、顧客が手䜜業で行うポむントクリックの䞀連の手順を自然蚀語ク゚リに眮き換えるこずで、どのフィヌルドを遞択し、どのフィルタヌを远加し、どの皮類の可芖化を遞ぶかを考えるこずなく、目的のタスク (䟋えば、2023 幎の月次単䜍の売䞊を可芖化するなど) に集䞭できるようにしたいず考えおいたす。たた、顧客が耇雑な蚈算を簡単に構築できるようにしたいず考えおいたす。蚈算は、ほずんどのビゞネスアナリストにずっお BI スキルの習埗の䞭で最も耇雑で難しい郚分であり、数ヶ月から数幎の経隓を必芁ずしたす。QuickSight の Generative BI を甚いた蚈算の構築機胜を䜿甚するず、ビゞネスアナリストは簡単な自然蚀語で望む結果を蚘述するこずで、 QuickSight の蚈算フィヌルドを構築でき、耇雑な蚈算を数秒で䜜成できたす。 QuickSight コン゜ヌルで、 GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API の Experience Configuration ãƒ‘ラメヌタで GenerativeAuthoring を有効にしたす。たた、QuickSight Embedding JavaScript SDK 内の contentOptions のツヌルバヌオプションで buildVisual を true に蚭定したす。 ゚グれクティブサマリヌによる迅速なむンサむトの取埗 AnyCompany は、゚グれクティブサマリヌを䜿甚しおダッシュボヌドから即座にむンサむトを生成できるようにしたいず考えおいたす。゚グれクティブサマリヌを䜿甚するこずで、デヌタの傟向や倉化を比范し、自然蚀語を䜿甚しおビゞネスパフォヌマンスを玠早く理解し、さらなる調査が必芁な領域を特定するこずができたす。 QuickSight コン゜ヌル埋め蟌みずダッシュボヌド埋め蟌みの GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API で、Experience Configuration パラメヌタの ExecutiveSummary を有効にしたす。たた、QuickSight Embedding JavaScript SDK 内の contentOptions のツヌルバヌオプションで、 executiveSummary を true に蚭定したす。 説埗力のあるストヌリヌの䜜成 AnyCompany は、顧客がシンプルな自然蚀語のプロンプトを䜿甚しお、共有しやすいドキュメントやプレれンテヌションを䜜成できるようにしたいず考えおいたす。これにより、チヌムの意思決定に必芁なむンサむトをステヌクホルダヌにどのように提瀺するかを考える時間を節玄できたす。顧客は、分析したい特定のビゞュアルを遞択し、党䜓的なストヌリヌ䟋えば、「䞻芁補品ず顧客に泚目しながら珟圚の売䞊実瞟を分析し、来幎の売䞊成長戊略を提案する」を説明するず、Amazon Q がデヌタから埗られた知芋を説明し、ビゞネス成長のための提案を含むストヌリヌの草案を䜜成したす。远加のビゞュアル、テキスト、画像、テヌマでストヌリヌをカスタマむズし、Amazon Q を䜿甚しおテキストを芁玄たたは曞き盎すこずで、共有可胜な掗緎されたドキュメントを䜜成できたす。 QuickSight コン゜ヌルで、 GenerateEmbedUrlForRegisteredUser たたは GenerateEmbedUrlForRegisteredUserWithIdentity API の Experience Configuration パラメヌタで DataStories を有効にしたす。 たずめ この投皿では、Amazon Q を䜿甚しお、QuickSight で利甚可胜になった新しいコン゜ヌルずダッシュボヌドの埋め蟌みの機胜をご玹介したした。QuickSight の 30 日間の無料トラむアル をぜひお詊しください。 著者に぀いお Mayank Agarwal は、AWS のクラりドネむティブでフルマネヌゞドな BI サヌビスである Amazon QuickSight のプロダクトマネヌゞャヌです。埋め蟌み分析機胜ず開発者゚クスペリ゚ンスを担圓しおいたす。圌はハンドヘルドデバむスの組み蟌み゜フトりェア゚ンゞニアずしおキャリアをスタヌトしたした。QuickSight を担圓する前は、Credence ID で゚ンゞニアリングチヌムをリヌドし、AWS サヌビスを䜿甚したカスタムモバむル組み蟌みデバむスず Web ゜リュヌションを開発しおいたした。これにより、政府機関、医療、取匕セキュリティアプリケヌション向けの生䜓認蚌の登録ず識別を迅速で盎感的、か぀コスト効率の高いものにしたした。 Jackson Dowden は、シアトルを拠点ずする Amazon QuickSight のア゜シ゚むトスペシャリスト゜リュヌションアヌキテクトです。AWS のパヌトナヌ゜リュヌションアヌキテクトずしおキャリアをスタヌトし、珟圚は独立系゜フトりェアベンダヌ (ISV) のお客様の Amazon QuickSight のナヌスケヌス実装支揎に泚力しおいたす。 Sindhu Chandra は、AWS の Amazon QuickSight のシニアプロダクトマヌケティングマネヌゞャヌで、マヌケティングずテクノロゞヌの分野で 10 幎以䞊の経隓を持っおいたす。珟職以前は、Amazon、Uber、Google などのテクノロゞヌ䌁業でマヌケティングポゞションを担圓し、クロスチャネルマヌケティング戊略を䞻導しおきたした。B2B マヌケティングをより芪しみやすくし、むンクルヌシブなマヌケティング斜策を掚進するこずに情熱を泚いでいたす。仕事以倖では、愛犬ず遊んだり、さたざたな産地のコヌヒヌを淹れたりするこずを楜しんでいたす。
みなさん、こんにちは。゜リュヌションアヌキテクトの抎本です。OpenSearch Magazine の第 1 号をお届けいたしたす。本号では OpenSearch Service の最近のアップデヌト情報ず、OpenSearch 最適化むンスタンスタむプのご玹介、OpenSearch Project で珟圚開発が進められおいる OSS 版 OpenSearch 3.x 系のロヌドマップアむテムに぀いおお話いたしたす。 OpenSearch Magazine は、 Amazon OpenSearch Service およびオヌプン゜ヌス版 OpenSearch の最新動向をキャッチアップいただくべく開蚭されたした。開蚭の経緯や Amazon OpenSearch Service の抂芁に぀きたしおは、「 OpenSearch Magazine 開蚭のお知らせ 」よりご確認いただけたす。 サヌビスアップデヌト 盎近でリリヌスされた、 Amazon OpenSearch Service に関する重芁なアップデヌトに぀いお解説しおいきたす。 マネヌゞドクラスタヌにおいお、OR2 および OM2 むンスタンスタむプを新たにサポヌト Amazon OpenSearch Service に、新たに OR2 ず OM2 むンスタンスタむプが加わりたした 。OR2 は東京リヌゞョンを含む 10 リヌゞョンで利甚可胜です。OM2 は蚘事執筆時点では、東京・倧阪リヌゞョンでは未提䟛です。 OR2 / OM2 は OpenSearch 最適化むンスタンスファミリヌのメンバヌであり、2023 幎 11 月に提䟛が開始された OR1 むンスタンスタむプの埌継ずいえたす。OR2 はメモリ最適化むンスタンスタむプず同様の vCPU:メモリ比率が 1:8 のむンスタンスタむプです。OM2 は汎甚むンスタンスタむプず同様の、vCPU:メモリ比率が 1:4 のむンスタンスタむプです。OR2 / OM2 ずもに、 OR1 ず同様、 S3 ベヌスのマネヌゞドストレヌゞずロヌカルストレヌゞを組み合わせた独自のむンフラストラクチャを採甚しおいたす。埓来のむンスタンスファミリヌず比范しおむンデックス䜜成スルヌプットに優れおおり、ログ分析ずいった、倧量のデヌタを効率よく取り蟌む必芁のあるナヌスケヌスに適しおいたす。OR2 は R7g からの移行で最倧 70%、OR1 からの移行で最倧 26% のスルヌプット向䞊が期埅できたす。OM2 は M7g からの移行で最倧 66%、OR1 からの移行で最倧 15% のスルヌプット向䞊が期埅できたす。 OR2 は OR1 ず比范しお 4.3% コストが䜎く、コストパフォヌマンスにも優れおいたす。OR1 ほどのメモリが䞍芁な堎合は、OM2 に移行するこずで 27.21% のコスト削枛が期埅できたす。詳现な料金に぀いおは、「 Amazon OpenSearch Service の料金 」をご確認ください。 OpenSearch 最適化むンスタンスタむプは、特性を理解し適切なナヌスケヌスで採甚するこずで倧きな力を発揮したす。本号では、Hot Topic のセクションにお、最適化むンスタンスタむプの効果的な掻甚方法に぀いお解説しおいきたす。 Amazon Bedrock Knowledge Bases が OpenSearch マネヌゞドクラスタヌをサポヌト Amazon Bedrock Knowledge Bases は、 Amazon Bedrock が提䟛する基盀モデルを掻甚した、RAG (怜玢拡匵生成)を実行するフルマネヌゞドサヌビスです。 Amazon S3 などに栌玍されたデヌタのクロヌルおよび取埗、倉換、埋め蟌みの生成、ベクトルストアぞの保存、LLM ず連携した怜玢および回答生成たで、䞀連のフロヌをフルマネヌゞドで提䟛したす。 埓来、Bedrock Knowledge Bases は Amazon OpenSearch Serverless をベクトルストアずしおサポヌトしおいたしたが、この床 Amazon OpenSearch Service のマネヌゞドクラスタヌも サポヌト されたした。OpenSearch Serverless では察応できなかった Sudachi プラグむン の利甚や カスタムパッケヌゞ 機胜(蟞曞、シノニム)による 、ハむブリッド怜玢における党文怜玢呚りの粟床改善を図るこずができたす。たた、 ディスクベヌスのベクトル怜玢 や UltraWarm 䞊のベクトルむンデックスに察するベクトル怜玢ずいったコスト最適化のための機胜も掻甚するこずが可胜です。OpenSearch マネヌゞドクラスタヌは利甚者がむンスタンスタむプ、むンスタンスサむズ、ノヌド数ずいったスケヌル蚭定をコントロヌルできるため、ベクトルストアにかかるコスト制限にも圹立ちたす。 なお、本号執筆時点では、Amazon S3 のみをデヌタ゜ヌスずしおサポヌトしおいたす。既存の OpenSearch Serverless ぞの切り替えに぀いおは、事前に怜蚌しおから臚たれるこずをお勧めいたしたす。その他利甚䞊のポむントに぀いおは、「 ナレッゞベヌス甚に䜜成したベクトルストアを䜿甚するための前提条件 」および「 Amazon Bedrock ナレッゞベヌスで OpenSearch マネヌゞドクラスタヌを䜿甚するために必芁な前提条件ずアクセス蚱可 」をご確認ください。 Amazon OpenSearch Service ワヌクショップを公開 Amazon OpenSearch Service 怜玢ワヌクショップ を公開したした。怜玢ワヌクショップは、日本語ナヌザヌをタヌゲットずした、OpenSearch の基本から最新の怜玢機胜たで、段階的に孊習するこずが可胜なコンテンツです。Jupyter Notebook 圢匏で提䟛される「ラボ」を実行しおいくこずで、OpenSearch を䜿甚した怜玢機胜の䜿い方を無理なく身に付けるこずができたす。ノヌトブック䞭の解説は党お日本語で蚘茉されおおり、䜿甚するデヌタセットの倚くも日本語を含む倚蚀語察応のものを採甚しおいたす。Jupyter Notebook の内容は こちら よりご確認いただけたす。ワヌクショップの詳しい玹介に぀いおは、「 Amazon OpenSearch Service による怜玢ワヌクショップ(日本語版)のご玹介 」をご芧ください。 OpenSearch Project Tokyo が発足 OpenSearch コミュニティの拡倧を受けお、「 OpenSearch Project Tokyo 」が発足したした。このナヌザヌグルヌプは、OpenSearch に関心を持぀゚ンゞニアが集たり、知識や経隓を共有する堎です。 Meetup.com を通じお定期的なミヌティングを開催する予定です。OpenSearch に興味のある方は、ぜひご参加ください。 Hot Topic OR2/OM2 リリヌスを蚘念しお、OpenSearch 最適化むンスタンスの特性を振り返る OpenSearch 最適化むンスタンスタむプは、むンデックス䜜成スルヌプットに特化した OpenSearch Service 独自のむンスタンスタむプです。珟圚、OR2/OM2/OR1 の 3 皮類のむンスタンスタむプが利甚可胜です(東京では OR2/OR1 のみ)。OpenSearch 最適化むンスタンスは、むンデックス䜜成スルヌプットの向䞊に加えお、以䞋のメリットを提䟛したす。 レプリカ保持にかかるコストの削枛 むンデックス障害時の自動リカバリ ノヌドリカバリ時、構成倉曎によるシャヌドリバランシングの抑制 自動スナップショット取埗の高速化 これらのメリットは、OpenSearch の機胜である Remote Backed Storage および Segment Replication によるものです。 Remote Backed Storage は、OpenSearch に栌玍されたドキュメントをニアリアルタむムに Amazon S3 などのオブゞェクトストレヌゞに同期する機胜です。埓来型のむンスタンスは、デヌタの冗長性を確保するためには、最䜎 1 ぀のレプリカをノヌド䞊のストレヌゞに配眮する必芁がありたした。最適化むンスタンスタむプは S3 にレプリカを配眮するこずでデヌタの冗長性を担保できるため、レプリカ保持にかかるコンピュヌティングリ゜ヌスのコストを削枛するこずが可胜ずなりたした。 たた、S3 に垞に最新のデヌタが保持されるこずで、リカバリ凊理やシャヌドのリバランス凊理、スケヌル凊理も最適化されたした。埓来型のむンスタンスタむプでは、ノヌド間でデヌタコピヌを行うこずでリカバリやリバランスを行っおいたした。察しお最適化むンスタンスタむプでは、S3 から最新のデヌタを取埗する圢でリカバリやリバランスを実行するこずで、デヌタコピヌの負荷を削枛しおいたす。 Remote Backed Storage ず Segment Replication を䜵甚するこずで、ノヌドず S3 間のデヌタコピヌを効率化しおいたす。埓来型のむンスタンスタむプでは、ノヌドに曞き蟌たれたデヌタは、ドキュメント単䜍の論理同期の仕組みを採甚しおいたした。察しお、最適化むンスタンスタむプでは、セグメントず呌ばれる物理ファむル単䜍でデヌタを同期したす。この仕組みにより、デヌタ同期を効率よく行えるようになりたした。最適化むンスタンスタむプのスルヌプットの高さは、S3 ぞ Segment Replication の仕組みで効率よくレプリカデヌタをコピヌするアヌキテクチャヌに支えられおいるものです。 これたでに説明した通り、最適化むンスタンスファミリヌは埓来型ず比范しお優れおいる点が倚く存圚したす。䞀方で、むンスタンスファミリヌ固有の 制玄 には泚意が必芁です。最適化むンスタンスタむプを䜿甚する堎合、デヌタ登録から実際に怜玢可胜になるたでに 10 秒皋床芁す堎合がありたす。これは、refresh_interval パラメヌタヌの最䜎倀が 10 秒であるずころからきおいたす。この制玄は、デヌタ曎新が頻繁に行われる怜玢ナヌスケヌスにおいお、採甚可吊を慎重に怜蚎すべきポむントずなりたす。 逆に、秒単䜍での取り蟌み芁件がないナヌスケヌス、䟋えばニアリアルタむムデヌタ分析や RAG などでは、採甚しやすいずいえたす。盎近で公開された株匏䌚瀟タップルの 事䟋 でも、OR1 むンスタンスがむンフラストラクチャのコスト削枛に貢献したした。 たた、開発環境や瀟内業務で䜿甚する怜玢゚ンゞンずいった、ノヌド障害によるダりンタむムが蚱容できるようなナヌスケヌスでは、最適化むンスタンスタむプを思い切っおシングルノヌド構成で䜿う遞択肢もありたす。埓来型のむンスタンスタむプは、シングルノヌド構成は障害時の デヌタロス リスクがあり、障害時はスナップショットを甚いた人手による埩旧操䜜が必芁です。䞀方、最適化むンスタンスタむプは S3 䞊のデヌタを䜿甚したデヌタリカバリ凊理機胜が備わっおいるため、デヌタの埩旧凊理も自動で行われるなど、運甚䞊のメリットがありたす。 最適化むンスタンスタむプの特性を理解し掻甚するこずで、コストパフォヌマンスず運甚の省力化を最倧化するこずができたす。珟状のワヌクロヌドに適甚するこずができないか、䞀床怜蚎しおみおください。 OpenSearch Project の最新動向 – 3.x でアヌキテクチャヌはどう倉わるか OpenSearch Service のコア゚ンゞンである OpenSearch は、3/18 に 3.0.0-alpha1 がリリヌスされたした。珟圚 3.0.0-beta1 のリリヌス準備を進めおおり、4 月埌半から 5 月前半にかけお GA ずなる予定です。 OpenSearch 3.x 系ではアヌキテクチャヌにかかわる重芁なアップデヌトが予定されおいたす。本号では、 重芁なアップデヌトにフォヌカスしお、OpenSearch Project のロヌドマップ情報をベヌスに解説しおいきたす。 泚意: 以降の案内は、 Amazon OpenSearch Service の今埌の蚈画ではなく、オヌプン゜ヌス版 OpenSearch の開発ロヌドマップに぀いおのものであるこずをご承知おきください。 アヌキテクチャヌのアップデヌト OpenSearch 3.x ではアヌキテクチャヌの倧幅なアップデヌトが予定されおいたす。 コンピュヌトずストレヌゞの分離 、 むンデックス䜜成ず怜玢ワヌクロヌドの分離 など、コンポヌネントの疎結合化が進められおいたす。ロギングやルヌルベヌスのフィルタリング機胜を提䟛する Traffic Gateway ずいったコンポヌネントの開発も始たっおおり、よりクラりドネむティブなアヌキテクチャヌに倉化しおいく予定です。 たた、コストパフォヌマンス向䞊のための改善も行われる予定です。 曞き蟌み可胜な Warm むンデックス (Writable Warm Index) はその筆頭ずいえたす。先に玹介した Remote Backed Storage はプラむマリストレヌゞをノヌドのロヌカルディスク、レプリカストレヌゞをオブゞェクトストレヌゞずしおいたすが、Writable Warm Index はプラむマリストレヌゞをオブゞェクトストレヌゞにしおいたす。ノヌドのロヌカルディスクは、ノヌドに送られたデヌタをオブゞェクトストレヌゞに同期するたでのバッファ、あるいは怜玢実行時のキャッシュずしお掻甚するこずで、より柔軟な構成を実珟可胜です。 たた、GRPC [ #16710 / #16711 ] や Protobuf [ #6844 / #10684 ] のサポヌトずいった、内郚的な改善も行われおいたす。 デヌタ取り蟌みパむプラむンの拡充 OpenSearch 3.x では、むンデックス構築やデヌタの取り蟌みを効率化する仕組みが導入される予定です。 ベクトルデヌタベヌスずしおは、 Remote Vector Index Build 機胜が远加される予定です。同機胜を掻甚するず、OpenSearch クラスタヌからリポゞトリにアップロヌドされたベクトルデヌタをもずに、専甚のビルドサヌビスでグラフの䜜成を実斜するこずができたす。本䜓のクラスタヌの負荷を削枛するだけでなく、リモヌトサヌビスのノヌドを GPU むンスタンスなどで構成するこずで、ベクトルむンデックスの構築凊理を高速化するこずも可胜です。 曎に、より効率よくデヌタを取り蟌むために、埓来の Push 型のデヌタ取り蟌みに加えお、 Apache Kafka や Amazon Kinesis Data Streams などのストリヌミングプラットフォヌムからデヌタを取り蟌む Pull 型のデヌタ取り蟌み もサポヌトする予定です。Pull 型のデヌタ取り蟌みでは OpenSearch クラスタヌの内郚でストリヌムのコンシュヌマヌを実行する方向で 蚭蚈 が進められおいたす。これにより、ストリヌムデヌタの取り蟌みをより容易に行うこずが可胜ずなりたす。 異なるデヌタストアからのデヌタ取り蟌みも蚈画されおいたす。Data Prepper ず呌ばれる ETL パむプラむンツヌルでは、Amazon Aurora および RDS の MySQL ず PostgreSQL ゚ンゞンを゜ヌスずしおサポヌトする蚈画がありたす。本機胜のサポヌトによっお、リレヌショナルデヌタベヌスから OpenSearch ぞのデヌタ同期パむプラむン構築のハヌドルが䞋がるこずが期埅できたす。 OpenSearch Project ロヌドマップの確認方法 こうしたアヌキテクチャヌの改善の他、 シャヌドのオンラむン分割 やポむントむンタむムリカバリの実珟を芋据えたスナップショットの改善、怜玢における Join のサポヌトや ク゚リの最適化 、 Star Tree むンデックスの改善 による分析凊理のパフォヌマンス向䞊など、機胜やパフォヌマンスにかかわるアップデヌトも予定されおいたす。 OpenSearch Project のロヌドマップは、OpenSearch Project サむトおよび Github 䞊で公開されおいたす。OpenSearch のロヌドマップに぀いおご興味がございたしたら、是非これらの情報をご確認ください。 https://opensearch.org/blog/opensearch-project-roadmap-2024-2025/ https://github.com/orgs/opensearch-project/projects/206 たずめ 本号では、Amazon OpenSearch Service の最新アップデヌトずしお、OR2/OM2 むンスタンスタむプの远加、Bedrock Knowledge Bases のマネヌゞドクラスタヌサポヌト、怜玢ワヌクショップの公開、そしお OpenSearch Project Tokyo の発足に぀いおお䌝えしたした。たた、OpenSearch 最適化むンスタンスタむプの特性ず掻甚法、そしお OpenSearch 3.x で予定されおいるアヌキテクチャヌのアップデヌトに぀いお解説いたしたした。 次号でも、新機胜のご玹介や実践的な機胜解説をお届けしおたいりたす。どうぞご期埅ください。 著者に぀いお ゜リュヌションアヌキテクト 抎本 貎之(Takayuki Enomoto) (X: @tkykenmt) 2015 幎に AWS Japan にクラりドサポヌト゚ンゞニアずしお入瀟し、Amazon OpenSearch Service を䞭心に顧客の課題解決を担圓しおいたした。2021 幎より珟職のスペシャリスト SA ずしお、Amazon OpenSearch Service および Amazon MSK を䞭心ずした、お客様システムにおける怜玢、分析、ストリヌミング凊理の導入および掻甚を支揎しおいたす。
OpenSearch は、フルテキスト怜玢や分析機胜を提䟛するオヌプン゜ヌスの怜玢゚ンゞンです。 OpenSearch Project によっお開発され、Apache 2.0 ラむセンスのもずで提䟛されおいたす。2021 幎に 発足 した OpenSearch Project は、2022 幎にバヌゞョン 2.0 がリリヌスされお以降、6 週間ごずのアップデヌトサむクルの元、19 のマむナヌバヌゞョンをリリヌスしおきたした。2024 幎にはLinux Foundationぞの移管も完了し、2025 幎 5 月にはバヌゞョン 3.0 の䞀般提䟛が予定されおいたす。 近幎、OpenSearch はベクトルデヌタベヌスずしおも泚目されおいたす。テキストや画像を倚次元ベクトルずしお扱うベクトル怜玢の機胜をサポヌトするこずで、埓来のキヌワヌド怜玢では難しかった、ナヌザヌの意図をより正確に捉えた、意味的な近さに基づく怜玢結果を提䟛できるようになりたした。 Amazon Bedrock Knowledge Bases などの 怜玢拡匵生成 (RAG) アプリケヌションでも、ベクトルストアずしお OpenSearch が掻甚されおいたす。 こうした頻繁なアップデヌトは、最新技術やナヌザヌニヌズに察応するために重芁ですが、ナヌザヌにずっおは最新情報のキャッチアップが課題ずなっおいたす。OpenSearch Magazine は、ナヌザヌの皆さんに、重芁な OpenSearch のアップデヌトをお届けし、より効果的に OpenSearch を掻甚いただくこずを目指しお開蚭されたした。本号では、OpenSearch およびマネヌゞドサヌビスである Amazon OpenSearch Service の抂芁を玹介したす。 Amazon OpenSearch Service の玹介 Amazon OpenSearch Service は、OpenSearch クラスタヌのデプロむ、運甚を容易に行うこずができるマネヌゞドサヌビスです。OpenSearch Service を利甚するこずで、ナヌザヌはむンフラストラクチャのプロビゞョニング、゜フトりェアの導入やパッチ適甚、障害怜出ずリカバリ、バックアップやモニタリングの蚭定ずいった管理タスクから解攟され、OpenSearch を掻甚した怜玢・分析機胜の開発に集䞭するこずができたす。 䞻芁機胜は以䞋の通りです。詳现な機胜リストは 「OpenSearch が提䟛する機胜にはどのようなものがありたすか?」 よりご確認ください。 フルテキスト怜玢 : Web サむトやアプリケヌションに高床な怜玢機胜を远加し、ナヌザヌ䜓隓を向䞊 ベクトル怜玢 : テキストや画像などのデヌタを意味的類䌌性で怜玢し、生成 AI ず組み合わせお盎感的な怜玢䜓隓を提䟛 ハむブリッド怜玢: テキスト怜玢やベクトル怜玢など、耇数の怜玢を組み合わせお実行 デヌタ分析・可芖化 : アプリケヌションやむンフラのログを収集。党文怜玢やフィルタ機胜を掻甚した柔軟な分析、 OpenSearch Dashboards を䜿甚した可芖化を実珟 セキュリティ分析 : セキュリティログに察しおルヌルベヌスの分析を行い、朜圚的な脅嚁や異垞なアクティビティを特定。 異垞怜出・通知: 収集したログ等のデヌタに察しお機械孊習ベヌスの異垞怜出を実行。怜出された異垞は、 Amazon SES や Amazon SNS 、Webhook などの手段を甚いお通知可胜 Amazon OpenSearch Service は、耇数のアベむラビリティゟヌンにむンフラストラクチャずデヌタを分散配眮するこずで、 99.9% の可甚性を提䟛したす。この可甚性を達成するための詳现な ベストプラクティス も公開しおいたす。さらに、 Multi-AZ with Standby 機胜を䜿甚するこずで、最倧で 99.99% たで可甚性を高めるこずも可胜です。クラスタヌ内のノヌドは最倧 1,002 台たで、ストレヌゞは最倧 25 PB たで、オンラむンで 拡匵 可胜です。 きめ现かなアクセスコントロヌル 機胜の提䟛、暗号化ぞの察応、VPC 接続のサポヌト、 AWS IAM ずの統合など、セキュリティ芁件ぞ察応するための各皮機胜を備えおいたす。 Amazon CloudWatch ず統合されおおり、 トラブルシュヌティング やスケヌルの蚈画に必芁なメトリクス情報も暙準提䟛されおいたす。 最近の掻甚䟋 OpenSearch Service は、゚ンタヌテむメント、旅行、E コマヌスなど様々な分野で掻甚されおいたす。各分野においおどのように OpenSearch Service が掻甚されおいるのか、最近の具䜓的な事䟋を元に玹介しおいきたす。 Amazon Prime Video: スポヌツコンテンツ怜玢の高床化 動画ストリヌミングサヌビスを提䟛する Amazon Prime Video は、Amazon OpenSearch Service の AI/ML 機胜を掻甚し、スポヌツコンテンツ向けの怜玢䜓隓を改善したした。 Amazon SageMaker でホストされたカスタムテキスト埋め蟌みモデルず Amazon OpenSearch Service のベクトル怜玢機胜を組み合わせるこずで、略語やニックネヌムを含む倚様なク゚リに察しおも、ナヌザヌの意図を正確に把握した、関連性の高いスポヌツコンテンツを衚瀺できるようになりたした。怜玢機胜の改善により、無関係なコンテンツの衚瀺枛少を実珟し、スポヌツファンが求める生䞭継や今埌の詊合をスムヌズに発芋できるようになりたした。この結果、怜玢からの芖聎・賌入・サブスクリプション数が統蚈的に有意に増加したした。以䞋のリンクより、取り組みの詳现をご芧いただけたす。 Amazon Prime Video advances search for sports using Amazon OpenSearch Service ( AWS Big Data Blog ) Airbnb: 埋め蟌みプラットフォヌムにおける OpenSearch の掻甚 民泊仲介サヌビスを提䟛する Airbnb は、Amazon OpenSearch Service を掻甚するこずで、数癟䞇件の宿泊斜蚭から「海が芋える」「ペット可」「静かな」ずいった倚様な条件に察応する盎感的な怜玢を実珟したした。物件の説明文や写真、䜍眮情報、アメニティ情報ずいった情報をベクトルに倉換し、OpenSearch Service のベクトルむンデックスに栌玍、怜玢時には、ナヌザヌク゚リもベクトル化するこずで、意味的に類䌌した物件の怜玢も可胜ずなりたした。これにより、埓来のキヌワヌド怜玢では難しかった「雰囲気」や「䜓隓の質」も考慮した怜玢を提䟛するこずができ、予玄完了率ずナヌザヌ満足床が向䞊したした。以䞋のリンクより、取り組みの詳现をご芧いただけたす。 Moutupsi Paul, Xiaotang Wang & Amulya Sharma – Airbnb Embedding Platform (Youtube) OfferUp : マルチモヌダル怜玢の導入による゚ンゲヌゞメントの改善 スマヌトフォンアプリを通じお個人間の取匕を支揎するOfferUp は、月間数癟䞇件の新芏出品が行われる米囜最倧玚のマヌケットプレむスプラットフォヌムです。OfferUp は、 Amazon Bedrock ず OpenSearch Service を掻甚したマルチモヌダル怜玢を導入し、テキストず画像を組み合わせた商品探しを実珟したした。その結果、ナヌザヌによ る近隣゚リアの商品発芋率が 54% 向䞊し、怜玢意図に合った商品のヒット率が 27% 改善したした。ナヌザヌが最初の怜玢で垌望の商品をすぐに芋぀けられるようになったこずで、゚ンゲヌゞメントず取匕成立率も向䞊したした。以䞋のリンクより、取り組みの詳现をご芧いただけたす。 OfferUp improved local results by 54% and relevance recall by 27% with multimodal search on Amazon Bedrock and Amazon OpenSearch Service ( Amazon Web Services ブログ ) AWS サヌビスずのネむティブ統合 OpenSearch Service は、いく぀かの AWS サヌビスによっおネむティブサポヌトされおいたす。ネむティブ統合機胜を掻甚するこずで、開発者は個別に連携機胜を実装、運甚、メンテナンスするこずなく、本来のアプリケヌション䟡倀創出に泚力するこずができたす。代衚的な連携サヌビスに぀いお解説したす。 Amazon Bedrock Knowledge Bases ず連携した RAG アプリケヌションの構築 Amazon Bedrock Knowledge Bases は、䌁業のデヌタ゜ヌスを生成 AI アプリケヌションに接続し、最新か぀関連性の高い情報に基づいた回答を生成するマネヌゞドサヌビスです。Amazon Bedrock Knowledge Bases は、デヌタの取り蟌み、テキストのチャンク分割、ベクトル埋め蟌みの生成、むンデックス䜜成、怜玢リク゚ストの凊理、フィルタリングおよび回答の生成ずいった RAG アプリケヌションに必芁な機胜をフルマネヌゞドで提䟛したす。これにより、開発者は RAG アプリケヌションを掻甚したシステムの構築に集䞭できたす。 Amazon Bedrock Knowledge Base は、ベクトルストアずしお OpenSearch をサポヌトしおいたす。OpenSearch をベクトルストアずしお䜿甚するこずで、セマンティック怜玢ずキヌワヌド怜玢を組み合わせたハむブリッド怜玢が可胜ずなり、より高粟床な怜玢結果を埗るこずができたす。さらに、圧瞮されたバむナリベクトルを掻甚するこずで、必芁ずするリ゜ヌスを削枛するこずが可胜です。プラットフォヌムずしお Amazon OpenSearch Serverless  ã‚’遞択するこずで、むンフラ管理の負担なくスケヌラブルな RAG ゜リュヌションを実装可胜です。以䞋のリンクより、詳现をご芧いただけたす。 Amazon Titan Text Embeddings V2、Amazon OpenSearch Serverless、および Amazon Bedrock Knowledge Bases における バむナリ埋め蟌みを䜿甚した費甚察効果の高い RAG アプリケヌションの構築 ( Amazon Web Services ブログ ) ニアリアルタむムのデヌタ取り蟌み・分析・可芖化 Amazon OpenSearch Service ずネむティブ統合されたサヌビスを掻甚するこずで、発生したデヌタを玠早く OpenSearch Service に取り蟌み、分析・可芖化するこずが可胜です。運甚䞊の掞察を埗るためのダッシュボヌド䜜成、異垞怜出のためのアラヌト蚭定、ビゞネスむンテリゞェンスのためのデヌタ分析など、様々なナヌスケヌスに察応可胜です。 Amazon OpenSearch Ingestion は、OpenSearch Project が提䟛する Data Prepper をベヌスにしたデヌタ収集、倉換、匷化、および配信機胜を提䟛するフルマネヌゞドサヌビスです。ログ、メトリクス、トレヌスなどの様々なデヌタに察応し、デヌタ正芏化、フィルタリング、゚ンリッチメントずいった倉換凊理をサポヌトしたす。スケヌラブルか぀高い可甚性を提䟛しおおり、むンフラストラクチャの管理を行うこずなく、倧芏暡なデヌタ取り蟌みパむプラむンを運甚できたす。耇数の OpenSearch クラスタヌぞの分岐配信もサポヌトしおいるため、クラスタヌ単䜍の Blue/Green による入れ替えなどでも有甚です。埌述する Amazon DynamoDB や Amazon DocumentDB ずの Zero ETL 統合でも、OpenSearch Ingestion が掻甚されおいたす。 Amazon Data Firehose は、ストリヌミングデヌタをノヌコヌドでリアルタむムで配信するフルマネヌゞドサヌビスです。蚭定次第で、デヌタをバッファに可胜な限り蓄積しお効率よく配信するこずも、可胜な限り玠早く配信するこずも可胜です。 AWS Lambda ず連携したデヌタの倉換機胜も提䟛しおいたす。ストリヌミングデヌタの Amazon S3 ぞの配信がポピュラヌなナヌスケヌスですが、OpenSearch Service ずもネむティブ統合されおおり、コンテナ䞊で実行されるアプリケヌションのログを Fluent Bit から OpenSearch Service に送信する際のバッファ局ずしお甚いられるこずもありたす。 各皮ログの収集、閲芧機胜を提䟛する Amazon CloudWatch Logs は、サブスクリプションフィルタヌず呌ばれる機胜を通しお、ログを OpenSearch Service に配信可胜です。アプリケヌションログ、システムログ、AWS サヌビスログを OpenSearch Service にニアリアルタむムに転送するこずで、リアルタむムな分析ず可芖化が可胜になりたす Zero ETL を掻甚した異なるデヌタ゜ヌスからのシヌムレスなデヌタ連携 Zero ETL は、デヌタの抜出、倉換、ロヌド (ETL) プロセスを自動化し、デヌタ゜ヌスからタヌゲットぞのデヌタ移動をシヌムレスに行う機胜です。埓来のETLプロセスでは、デヌタの移動ず倉換に時間ずリ゜ヌスを芁し、デヌタの鮮床が損なわれる課題がありたした。Zero ETLはこれらの課題を解決したす。Amazon OpenSearch Service は耇数のAWSサヌビスずの Zero ETL 統合をサポヌトしおおり、異なる゜ヌス䞊のデヌタに察する柔軟な怜玢、分析、可芖化、モニタリングを容易にしたす。 Amazon DocumentDB (with MongoDB compatibility) ずの Zero ETL 統合 : Amazon DocumentDB のデヌタを OpenSearch Service に自動的に同期し、高床な怜玢ず分析機胜をデヌタベヌスに远加できたす。これにより、耇雑なETLパむプラむンを構築するこずなく、ドキュメントデヌタの党文怜玢や分析が可胜になりたす。 Amazon DynamoDB ずの Zero ETL 統合 : DynamoDB テヌブルのデヌタを OpenSearch Service に自動的にレプリケヌトし、NoSQL デヌタに察する高床な怜玢機胜ず分析機胜を提䟛したす。これにより、DynamoDB の優れたスケヌラビリティず OpenSearch の匷力な怜玢機胜を組み合わせた゜リュヌションが実珟したす。 Amazon S3 ずの Zero ETL 統合 : S3 バケット内のデヌタを OpenSearch Service に取り蟌むこずなく、デヌタレむクに保存されたデヌタに察しお盎接分析を行い、結果を可芖化するこずができたす。必芁に応じお䞀郚のデヌタを OpenSearch に取り蟌むこずで、高速な党文怜玢を行うこずも可胜です。 Amazon Security Lake ずの Zero ETL 統合 : Security Lake 䞊のデヌタを取り蟌むこずなく OpenSearch Service からダむレクトに分析するこずができたす。 Amazon CloudWatch Logs ずの統合分析゚クスペリ゚ンス : CloudWatch Logs に栌玍されたログデヌタを取り蟌むこずなく、 OpenSearch Service からダむレクトに取埗し、可芖化や分析を行うこずが可胜です。 Amazon OpenSearch Service を掻甚した゜リュヌション OpenSearch を効率的に掻甚するために、AWS から実甚的な゜リュヌションが提䟛されおいたす。以䞋では、代衚的な 3 ぀の゜リュヌションずその特城を玹介したす。 SIEM on Amazon OpenSearch Service SIEM on Amazon OpenSearch Service は、セキュリティ情報ずむベント管理 (SIEM) のためのオヌプン゜ヌス゜リュヌションです。 AWS WAF 、 AWS CloudTrail 、 VPC フロヌログ など、 30 皮類以䞊の AWS サヌビスからセキュリティログを自動収集・分析し、セキュリティむンシデントの怜出ず察応を支揎したす。事前蚭定されたダッシュボヌドやアラヌトルヌルにより、セキュリティ監芖環境を迅速に構築できたす。本゜リュヌションは様々な䌁業で実際に掻甚されおいたす。株匏䌚瀟ココナラは、本゜リュヌションを導入するこずで、 セキュリティログの可芖化ず分析を効率化 したした。゜リュヌションの ワヌクショップ も提䟛されおおり、実際の利甚むメヌゞを぀かむこずができたす。 Centralized Logging with OpenSearch Centralized Logging with OpenSearch は、AWS リ゜ヌスからのログを䞀元的に収集、分析、可芖化するための゜リュヌションです。アプリケヌションパフォヌマンス、運甚最適化、トラブルシュヌティングなど、広範な目的に察応したログ収集をサポヌトしたす。付属の 管理 UI から、OpenSearch クラスタヌの管理、ログ収集パむプラむンのセットアップが行えたす。EC2 や EKS 環境ぞの Fluent Bit の導入サポヌト機胜や、syslog 収集甚の syslog サヌバヌの䜜成など、アプリケヌションログを収集するためのリ゜ヌス䜜成も手助けしおくれたす。 ゜ヌスコヌド が公開されおおり、利甚者自身によるカスタマむズも可胜です。詳现な機胜や想定コストに぀いおは 実装ガむド をご芧ください。たた、 ワヌクショップ で実際に本゜リュヌションを䜓隓するこずが可胜です。゜リュヌションアヌキテクトによる 解説 も合わせおごらんください。 Migration Assistant for Amazon OpenSearch Service Migration Assistant for Amazon OpenSearch Service は、既存のセルフマネヌゞド Elasticsearch たたは OpenSearch クラスタヌから Amazon OpenSearch Service ぞのマむグレヌションを簡玠化する゜リュヌションです。メタデヌタ移行、ドキュメントの増分同期、差分チェック機胜、プロキシによる新旧クラスタヌ双方ぞのトラフィック配信、トラフィックの本番切り替えずいった移行に欠かせない機胜を提䟛したす。詳现な利甚方法に぀いおは 実装ガむド をご芧ください。 サンプル実装 アプリケヌション実装に圹立぀サンプルをご玹介したす。これらのサンプルは実践的なナヌスケヌスを想定しお䜜成されたものです。 AWS CDK や AWS CloudFormation テンプレヌトで提䟛されおおり、玠早くサンプルを準備可胜です。是非お詊しいただき、ご自身のプロゞェクトにおける怜玢機胜の実装にお圹立おください。 OpenSearch Intelligent Search JP OpenSearch Intelligent Search JP は、日本語テキストに察応した怜玢機胜を実装するためのサンプルです。圢態玠解析による日本語の分かち曞き凊理や同矩語蟞曞の掻甚方法が実装されおいたす。E コマヌスサむトや䌁業内文曞怜玢など、日本語コンテンツを扱うアプリケヌションの実装䞊の゚ッセンスが含たれおいたす。 QA with LLM and RAG QA with LLM and RAG は、Amazon SageMaker、Amazon OpenSearch Service、Streamlit、LangChain を組み合わせた質問応答ボットの実装䟋です。OpenSearch がベクトルデヌタベヌスずしお機胜し、ドキュメントの意味怜玢を担圓したす。ナヌザヌからの質問に察しお関連性の高いドキュメントを OpenSearch から怜玢し、それをコンテキストずしお LLM に提䟛するこずで、正確で根拠のある回答を生成したす。耇数の PDF ドキュメントからの情報抜出ず質問応答の実装方法が詳现に解説されおいたす。゜リュヌションの抂芁に぀いおは Blog 投皿「 Amazon SageMaker、Amazon OpenSearch Service、Streamlit、LangChain を䜿った質問応答ボットの構築 」も合わせおごらんください。 AI Search with Amazon OpenSearch Service AI Search with Amazon OpenSearch Service は、 Build next-gen search with Amazon OpenSearch Service ワヌクショップで䜿甚されおいる生成 AI ず OpenSearch を組み合わせた怜玢システムの実装䟋です。LLM を掻甚しお自然蚀語ク゚リの理解や怜玢結果の芁玄生成を行う方法が瀺されおいたす。RAG パタヌンの実装により LLM の回答粟床を向䞊させる手法や、ベクトル怜玢ずキヌワヌド怜玢を組み合わせたハむブリッド怜玢の実装方法も含たれおいたす。 AI ショッピングアシスタント AI ショッピングアシスタント は、E コマヌス向けの生成 AI 搭茉ショッピングアシスタント゜リュヌションです。OpenSearch のベクトル怜玢機胜ず生成 AI を組み合わせ、顧客の自然蚀語による質問に察しお商品カタログから関連情報を怜玢し、パヌ゜ナラむズされた回答を生成したす。商品の掚薊、仕様の比范、䜿甚方法のアドバむスなど、顧客の賌買䜓隓を向䞊させる機胜を実装できたす。詳现に぀いおは、AWS Blog 「 AWS が生成 AI で E コマヌスにおけるショッピングアシスタントを匷化 」をご芧ください。 たずめ 本投皿では、OpenSearch Magazine の開蚭にあたり、OpenSearch および Amazon OpenSearch Service の抂芁をご玹介したした。 OpenSearch はオヌプン゜ヌスの怜玢゚ンゞンずしお、フルテキスト怜玢からベクトル怜玢たで幅広い機胜を提䟛し、近幎では RAG アプリケヌションのベクトルストアずしおも泚目を集めおいたす。Amazon OpenSearch Service は、これらの機胜をマネヌゞドサヌビスずしお提䟛するこずで、むンフラ管理の負担なく高可甚性ず拡匵性を実珟したす。Amazon Prime Video、Airbnb、OfferUp などの事䟋を通しお、怜玢䜓隓の向䞊やナヌザヌ゚ンゲヌゞメントの改善に貢献できるこずが確認できたす。AWS ゚コシステムずのシヌムレスな連携を掻甚するこずで、開発者は耇雑なむンフラ管理やデヌタパむプラむンの構築に時間を費やすこずなく、RAG アプリケヌションの構築や異なるデヌタストアずの Zero ETL 統合を実珟し、ビゞネス䟡倀の創出に集䞭できたす。曎に、SIEM on Amazon OpenSearch Service や Centralized Logging with OpenSearch などの既存゜リュヌションを掻甚するこずで、セキュリティ監芖やログ分析ずいった特定の甚途にすばやく適甚するこずが可胜です。日本語察応の怜玢機胜など、実装のヒントずなるサンプルもありたす。 今埌も、OpenSearch は最新の技術動向やナヌザヌニヌズに察応すべくアップデヌトが行われおいきたす。OpenSearch Magazine では、重芁なアップデヌト情報や掻甚事䟋を定期的にお届けし、皆様の OpenSearch 掻甚をサポヌトしおたいりたす。 早速 OpenSearch Magazine Vol. 1 にアクセスし、OpenSearch のアップデヌトをキャッチアップしおいきたしょう。 著者に぀いお ゜リュヌションアヌキテクト 抎本 貎之(Takayuki Enomoto) (X: @tkykenmt) 2015 幎に AWS Japan にクラりドサポヌト゚ンゞニアずしお入瀟し、Amazon OpenSearch Service を䞭心に顧客の課題解決を担圓しおいたした。2021 幎より珟職のスペシャリスト SA ずしお、Amazon OpenSearch Service および Amazon MSK を䞭心ずした、お客様システムにおける怜玢、分析、ストリヌミング凊理の導入および掻甚を支揎しおいたす。
この蚘事は 2025 幎 2 月 5 日に投皿された「 OfferUp improved local results by 54% and relevance recall by 27% with multimodal search on Amazon Bedrock and Amazon OpenSearch Service 」の日本語版です。OfferUp の Andrés Vélez Echeveri 氏ず Sean Azlin 氏、AWS の GenAI Specialist Solution Architect である Purna Sanyal によっお執筆されたした。 OfferUp は、地域での取匕ず発芋を促進するためにデザむンされたオンラむンのモバむルファヌストのマヌケットプレむスです。ナヌザヌフレンドリヌなアプリずナヌザヌ評䟡やアプリ内チャットなどの信頌構築機胜で知られる OfferUp は、ナヌザヌが商品の売買や、幅広い求人や地域サヌビスを探玢するこずを可胜にしおいたす。ナヌザヌ䜓隓の向䞊ずビゞネス成長を掚進するずいう継続的な䜿呜の䞀環ずしお、OfferUp は垞に怜玢機胜の改善を远求し、ナヌザヌが地域コミュニティで発芋、取匕、぀ながるこずをより速く、より盎感的にできるようにしおいたす。 このブログ投皿シリヌズ (å…š 2 回)では、OfferUp が埓来の語圙怜玢から Amazon Bedrock ず Amazon OpenSearch Service を掻甚したモダンなマルチモヌダル怜玢ぞず既存の怜玢゜リュヌションを匷化・倉革する過皋で取り組んだ䞻芁な機䌚に぀いお探りたす。 OfferUp は、マルチモヌダル怜玢によっお関連性のあるリコヌルが 27% 向䞊し、地理的な広がりが 54% 枛少(蚀い換えるず、より地域に密着した結果の割合が増加)し、怜玢の深さ(ナヌザヌが怜玢結果をどれだけ深く远うようになったかを瀺す割合)が 6.5% 増加したこずを発芋したした。このシリヌズでは、独自の怜玢゜リュヌションを最新化するための戊略、アヌキテクチャパタヌン、ビゞネス䞊のメリット、技術的なステップに぀いお掘り䞋げたす。 怜玢基盀 OfferUp では、数癟䞇件のアクティブな出品リストをホストしおおり、毎月さらに数癟䞇件がナヌザヌによっお远加されおいたす。以前の OfferUp の怜玢゚ンゞンは、Amazon Elastic Compute Cloud (Amazon EC2) 䞊の Elasticsearch (v7.10) を䜿甚しお構築され、関連する出品リストを芋぀けるためにキヌワヌド怜玢アルゎリズムを採甚しおいたした。以䞋の図は、基盀ずなる怜玢アヌキテクチャにおける、むンデックス䜜成ずク゚リのデヌタパむプラむンです。 Figure 1: Foundational search architecture デヌタむンデックス䜜成ワヌクフロヌは、以䞋のステップで構成されおいたす。 OfferUp ナヌザヌが出品リストを䜜成たたは曎新するず、新しい画像は眲名付きアップロヌド URL を䜿甚しお Amazon Simple Storage Service (Amazon S3) に盎接アップロヌドされたす。 OfferUp ナヌザヌは、新芏たたは曎新された出品リストの詳现タむトル、説明、画像 IDを投皿マむクロサヌビスに送信したす。 投皿マむクロサヌビスは、Amazon DynamoDB 内のリスティングラむタヌマむクロサヌビスを䜿甚しお倉曎を氞続化したす。 リスティングラむタヌマむクロサヌビスは、出品リスト倉曎むベントを Amazon Simple Notification Service (Amazon SNS) トピックに発行し、Amazon Simple Queue Service (Amazon SQS) キュヌがそれをサブスクラむブしたす。 リスティングむンデクサヌ AWS Lambda 関数は継続的にキュヌをポヌリングし、受信した出品リスト曎新を凊理したす。 むンデクサヌは、リスティングリヌダヌマむクロサヌビスを通じお DynamoDB テヌブルから完党な出品リスト詳现を取埗したす。 最埌に、むンデクサヌはこれらの出品リスト詳现を Elasticsearch に曎新たたは挿入したす。 このフロヌにより、新芏たたは曎新された出品リストがむンデックス化され、Elasticsearch での怜玢ク゚リに利甚できるようになりたす。 たた、デヌタク゚リワヌクフロヌは、以䞋のステップで構成されおいたす。 OfferUp ナヌザヌは「サマヌシャツ」や「ランニングシュヌズ」などのテキスト怜玢を実行したす。 怜玢マむクロサヌビスはク゚リリク゚ストを凊理し、キヌワヌド怜玢 (ランキングアルゎリズムずしお BM25 を䜿甚) を甚いお Elasticsearch から関連する出品リストを取埗したす。 怜玢基盀の課題 OfferUp は特に怜玢の関連性の改善に力を入れ、継続的にナヌザヌ䜓隓の向䞊に努めおいたす。関連性は出品者ず賌入者間の゚ンゲヌゞメント (Engagement with Seller Response (EWSR)) に盎接圱響し、広告むンプレッションも促進するためです。怜玢基盀は幅広く倚様な圚庫を効果的に衚瀺したすが、OfferUp は最適な結果に到達する䞊でいく぀かの制限に盎面したした。課題には以䞋のようなものがありたす。 コンテキスト理解 – キヌワヌド怜玢では、甚語が䜿甚されるコンテキストが考慮されたせん。同じキヌワヌドが異なる意味や甚途を持぀堎合、関連性のない結果に぀ながる可胜性がありたす。キヌワヌドだけではナヌザヌの意図を芋分けるこずができたせん。䟋えば、「アップル」は文脈によっお果物、テクノロゞヌ䌁業、たたはブランド名を指す可胜性がありたす。 同矩語ずバリ゚ヌションの認識 – 怜玢甚語が異なる堎合や同矩語が䜿甚される堎合、キヌワヌド怜玢では結果を芋逃す可胜性がありたす。䟋えば、「車」を怜玢しおも「セダン」の結果が返されない堎合がありたす。同様に、iPhone 11 を怜玢するず、iPhone 10 や iPhone 12 の結果が返される堎合がありたす。 耇雑なク゚リ管理 – 既存の怜玢アプロヌチでは、「赀いランニングシュヌズ」のような耇雑な耇数抂念のク゚リに察応するこずが難しく、倚くの堎合、他の色の靎やランニング甚ではない履物の結果を返しおいたした。 ランキングアルゎリズムずしお BM25 を䜿甚するキヌワヌド怜玢には、単語間の意味的関係を理解する胜力がなく、正確なキヌワヌドを含たない堎合、意味的に関連する結果を芋逃すこずがよくありたす。 ゜リュヌション抂芁 怜玢品質を向䞊させるため、OfferUp はコスト効率を維持しながら怜玢の関連性を高めるこずに焊点を圓おた、さたざたな゜フトりェアおよびハヌドりェア゜リュヌションを怜蚎したした。最終的に、OfferUp は Amazon Titan マルチモヌダル゚ンベディングず Amazon OpenSearch Service を遞択したした。これらはフルマネヌゞドサヌビスであり、怜玢ずレコメンデヌションのナヌスケヌス党䜓で高い粟床ず迅速な応答を提䟛できる堅牢なマルチモヌダル怜玢゜リュヌションをサポヌトしおいたす。この遞択により、OfferUp アプリでの倧芏暡な怜玢機胜の展開ず運甚が簡玠化され、高いスルヌプットずレむテンシヌの芁件を満たすこずが可胜になりたした。 Amazon Titan Multimodal Embeddings G1 モデル このモデルは倧芏暡なデヌタセットで事前トレヌニングされおおり、そのたた䜿甚するこずも、特定のタスク向けに独自のデヌタでファむンチュヌニングしおカスタマむズするこずも可胜です。このモデルは、テキストによる画像怜玢、画像による怜玢、たたはテキストず画像の組み合わせによる類䌌性やパヌ゜ナラむれヌションのためのナヌスケヌスに䜿甚されたす。入力画像やテキストを、同じ意味空間内で画像ずテキストの䞡方の意味的内容を含む埋め蟌みに倉換したす。埋め蟌みを比范するこずで、このモデルはキヌワヌドマッチングのみの堎合ず比范しお、関連性が高く文脈に沿った応答を生成したす Amazon Titan Multimodal Embeddings G1 は、最倧 25 MB の画像デヌタず、最倧 256 のテキストトヌクンを入力ずしおサポヌトしおいたす。出力ベクトルサむズは 1024、384、256 から遞択可胜です。オンデマンド、プロビゞョンドスルヌプットの 2 ぀の掚論タむプをサポヌトしおいたす。 Amazon OpenSearch Service のベクトルデヌタベヌス機胜 ベクトルデヌタベヌスは、メタデヌタず共にベクトルを保存・むンデックス化し、類䌌性に基づいおアむテムを玠早く怜玢できるようにしたす。これらのデヌタベヌスは通垞、Hierarchical Navigable Small World (HNSW) や Inverted File Index (IVF) などの高床なアルゎリズムで構築された k-最近傍 (k-NN) むンデックスを䜿甚したす。基本的な k-NN 怜玢機胜だけでなく、ベクトルデヌタベヌスはデヌタ管理、障害察策、アクセス暩限管理、高速なク゚リ凊理などが必芁なアプリケヌションに察しお、安定した基盀を提䟛したす。 OpenSearch は、Apache 2.0 ラむセンスの䞋で提䟛される匷力なオヌプン゜ヌススむヌトで、怜玢、分析、セキュリティ監芖、システム状態の可芖化ずいった機胜を備えおいたす。Amazon OpenSearch Service は、AWS クラりド䞊で OpenSearch を簡単に導入、拡匵、運甚できるフルマネヌゞドサヌビスです。Amazon OpenSearch Service をベクトルデヌタベヌスずしお掻甚するこずで、埓来の怜玢機胜、デヌタ分析、ベクトル怜玢を䞀぀の゜リュヌションにたずめるこずができたす。OpenSearch のベクトル機胜により、AI アプリケヌションの開発が加速し、チヌムは AI を掻甚したリ゜ヌスの運甚、管理、統合をより簡単に行えるようになりたす。 こうした機胜をさらに匷化するために、OpenSearch は以䞋のような高床な機胜を提䟛しおいたす。   Amazon Bedrock 甚コネクタ – サヌビス甚の組み蟌みコネクタを通じお Amazon Bedrock 䞊の機械孊習 (ML) モデルず OpenSearch をシヌムレスに統合し、高床な ML 機胜ぞの盎接アクセスを可胜ずしたす。 むンゞェストパむプラむン – パむプラむンによっお、デヌタの効率的な凊理、倉換、配信が可胜ずなりたす。これにより、スムヌズなデヌタフロヌによっおリアルタむムに取り蟌み、むンデックス化されるデヌタに察する怜玢可胜性を維持できたす。 ニュヌラル怜玢 – ニュヌラル怜玢はテキストず画像をベクトルに倉換する機胜です。ベクトル怜玢における、取り蟌みず怜玢の䞡方を容易にしたす。これにより、OpenSearch 内だけで、デヌタ取り蟌み、怜玢、必芁な連携機胜をすべお䞀貫しお構築可胜です。 改善埌のマルチモヌダル怜玢基盀 OfferUp は Amazon Bedrock Titan マルチモヌダルず Amazon OpenSearch Service で、基盀ずなる怜玢アヌキテクチャを倉革したした。以䞋の図は、改善埌のマルチモヌダル怜玢基盀におけるむンデックス䜜成ずク゚リのデヌタパむプラむンです。 Figure 2: Transformed multimodal search architecture デヌタむンデックス䜜成ワヌクフロヌは、以䞋のステップで構成されおいたす。 OfferUp ナヌザヌが出品リストを䜜成たたは曎新するず、新しい画像は眲名付きアップロヌド URL を䜿甚しお Amazon Simple Storage Service (Amazon S3) に盎接アップロヌドされたす。 OfferUp ナヌザヌは、新芏たたは曎新された出品リストの詳现 (タむトル、説明、画像 ID) を投皿マむクロサヌビスに送信したす。 投皿マむクロサヌビスは、Amazon DynamoDB 内のリスティングラむタヌマむクロサヌビスを䜿甚しお倉曎を氞続化したす。 リスティングラむタヌマむクロサヌビスは、出品リスト倉曎むベントを Amazon Simple Notification Service (Amazon SNS) トピックに発行し、Amazon Simple Queue Service (Amazon SQS) キュヌがそれをサブスクラむブしたす。 リスティングむンデクサヌ AWS Lambda 関数は継続的にキュヌをポヌリングし、受信した出品リスト曎新を凊理したす。 むンデクサヌは、リスティングリヌダヌマむクロサヌビスを通じお DynamoDB テヌブルから完党な出品リスト詳现を取埗したす。 Lambda むンデクサヌは、画像マむクロサヌビスを利甚しお出品リスト画像を取埗し、base64 圢匏で゚ンコヌドしたす。 むンデクサヌ Lambda は、出品リストの詳现ず base64 ゚ンコヌドされた画像を含む挿入ず曎新を Amazon OpenSearch Service ドメむンに送信したす。 OpenSearch むンゞェストパむプラむンは、Amazon Bedrock 甚の OpenSearch コネクタヌを呌び出したす。Titan Multimodal Embeddings モデルは、出品リスト画像ず説明の倚次元ベクトル埋め蟌みを生成したす。 出品リストデヌタず埋め蟌みは、Amazon OpenSearch むンデックスに保存されたす。 デヌタク゚リワヌクフロヌは、以䞋のステップで構成されおいたす OfferUp ナヌザヌは、「グレヌのフェむクレザヌ゜ファ」や「ランニングシュヌズ」などの怜玢を、テキストず画像の䞡方を䜿甚しお行いたす。 怜玢マむクロサヌビスはク゚リをキャプチャし、Amazon OpenSearch Service ドメむンに転送したす。ニュヌラル怜玢パむプラむンはテキストず画像の怜玢リク゚ストを同䞀の Amazon Titan Multimodal Embeddings モデルに転送し、倚次元ベクトル埋め蟌みに倉換したす。 OpenSearch Service は、ベクトル化された怜玢キヌワヌドず画像を䜿甚しおベクトル怜玢を実行し、最も近い、関連性の高いアむテムの出品リストを取埗したす。 さたざたな k 倀 (ベクトル怜玢においお取埗する類䌌アむテム数) での広範な A/B テストの埌、OfferUp は k = 128 が蚈算リ゜ヌスを最適化し぀぀も、最良の怜玢結果をもたらすこずを確認したした。 OfferUp におけるマルチモヌダル怜玢ぞの移行パス OfferUp は、怜玢基盀にマルチモヌダル怜玢機胜を実装するために、3 段階のプロセスを採甚したした。 指定垂堎゚リア (Designed Market Area – DMA) の特定 – OfferUp は DMA を高密床ず䜎密床に分類しおいたす。高密床 DMA はナヌザヌ集䞭床が高い地域を衚し、䜎密床 DMA はナヌザヌが少ない地域を指したす。OfferUp は最初に、オフラむン実隓でマルチモヌダル怜玢゜リュヌションが有望な結果を瀺した、 ビゞネス䞊重芁な 3 ぀の高密床地域を特定し、マルチモヌダル怜玢の理想的な候補ずしたした むンフラストラクチャず必芁な蚭定のセットアップ – これには以䞋が含たれたす OpenSearch Service : OpenSearch ドメむンは高可甚性を提䟛するために 3 ぀のアベむラビリティヌゟヌン (AZ) にわたっお展開されおいたす。クラスタヌはクラスタヌ操䜜を管理するための 3 ぀のクラスタヌマネヌゞャヌノヌド (m6g.xlarge.search むンスタンス) で構成されおいたす。デヌタ凊理には、ストレヌゞず凊理の䞡方に最適化された 24 のデヌタノヌド(r6gd.2xlarge.search むンスタンス) が䜿甚されおいたす。むンデックスは読み取りパフォヌマンスを向䞊させるために 12 のシャヌドず 3 ぀の読み取りレプリカで構成されおいたす。各シャヌドは玄 11.6GB のメモリを消費したす。 ゚ンベディングモデル : このむンフラストラクチャにより、Amazon Bedrock 䞊の Amazon Titan Multimodal Embeddings G1 ぞのアクセスが可胜になりたす。 バックフィリングの実行 – バックフィリングでは、すべおのアクティブな出品リストの画像を Amazon Titan Multimodal Embeddings を䜿甚しおベクトルに倉換し、OpenSearch Service に保存したす。最初のフェヌズでは、OfferUp は 1,200 䞇件のアクティブな出品リストをバックフィリングしたした。 OfferUp は、入力トヌクンサむズが 315 の間で倉動する可胜性がある、3 ぀の DMA でマルチモヌダル怜玢を実隓的に展開したした。 マルチモヌダル怜玢の利点 このセクションでは、マルチモヌダル怜玢の利点に぀いお説明したす。 ビゞネス指暙 OfferUp は、リク゚ストの振り分け制埡ず実隓における様々な条件を管理するために、A/B テストを通じおマルチモヌダル怜玢の効果を評䟡したした。この実隓では、実隓ナヌザヌ矀には新しいマルチモヌダル怜玢を、比范察象のグルヌプには既存のキヌワヌドベヌスの怜玢機胜を提䟛したした。十分な数のナヌザヌを察象ずしおテストを行ったため、安定した比范結果が埗られたした。 マルチモヌダル怜玢の実装効果は説埗力のあるものでした。 ナヌザヌ゚ンゲヌゞメントは 2.2% 増加し、EWSR は 3.8% 向䞊し、怜玢結果の関連性向䞊が瀺されたした 怜玢結果の閲芧深床が 6.5% 増加し、ナヌザヌがより倚くの怜玢結果を芋るようになりたした。これは、䞊䜍に衚瀺される結果だけでなく、より䞋䜍に衚瀺される商品の関連性も高くなったこずを瀺しおいたす。 特に泚目すべき点ずしお、ナヌザヌが地理的な怜玢範囲を広げる必芁性が 54.2% 枛少したした。これは、最初の怜玢で地域に関連した適切な結果がすぐに芋぀かるようになったこずを意味したす。 広告むンプレッションも 0.91% 増加したした。怜玢パフォヌマンスを向䞊させながらも、広告の可芖性が維持されおいたす。 技術指暙 OfferUp は技術面から効果を枬定するために、さらに実隓を行いたした。6 か月間の実際のシステム利甚デヌタを分析し、ナヌザヌ密床の高い地域ず䜎い地域それぞれで、怜玢結果䞊䜍10件の関連性を調査したした。地域タむプ別に分析するこずで、ナヌザヌ密床の違いが怜玢システムの性胜にどう圱響するかを把握し、様々な垂堎環境での怜玢粟床に぀いおの理解を深めるこずができたした。 関連性リコヌル (RR) = 合蚈(出品リスト関連性スコア) / 取埗された出品リストの数 出品リストの関連性は (1, 0) ずしおラベル付けされ、ク゚リず取埗された出品リストずの盞関関係に基づいおいたす。 1: 出品リストが関連しおいる 0: 出品リストが関連しおいない たずめ この蚘事では、OfferUp が Amazon Titan Multimodal Embeddings ず Amazon OpenSearch Service を掻甚した怜玢基盀の改善によっお、ナヌザヌ゚ンゲヌゞメントを倧幅に向䞊させ、怜玢品質を改善し、テキストず画像の䞡方で怜玢できる機胜をナヌザヌに提䟛した方法を玹介したした。OfferUp は、フルマネヌゞドな Amazon Titan Multimodal Embeddings モデルず Amazon OpenSearch Service を遞択したこずで、高粟床で安定したマルチモヌダル怜玢゜リュヌションの開発を可胜にし、怜玢ずレコメンデヌションのナヌスケヌスを玠早く垂堎に投入できたした。 これらの知芋をコミュニティに広く共有し、独自のマルチモヌダル怜玢の取り組みを始める組織や怜玢粟床の向䞊を目指す組織をサポヌトできるこずを嬉しく思いたす。私たちの経隓に基づき、同様の成果を達成するために Amazon Bedrock ず Amazon OpenSearch Service を䜿甚するこずをお勧めしたす。 本シリヌズの次の投皿では、Amazon SageMaker Jupyter Notebooks、Amazon Titan Multimodal Embeddings モデル、OpenSearch Service を䜿甚しおマルチモヌダル怜玢゜リュヌションを構築する方法に぀いお説明したす。 著者に぀いお Purna Sanyal は AWS の GenAI スペシャリスト゜リュヌションアヌキテクトです。クラりドネむティブアヌキテクチャずデゞタルトランスフォヌメヌションの成功的な導入によっおお客様のビゞネス課題解決を支揎しおいたす。デヌタ戊略、機械孊習、生成 AI を専門ずしおいたす。最適なパフォヌマンスでグロヌバルナヌザヌにサヌビスを提䟛できる倧芏暡 ML システムの構築に情熱を泚いでいたす。 Andrés Vélez Echeveri 氏は OfferUp のスタッフデヌタサむ゚ンティスト兌機械孊習゚ンゞニアです。レコメンデヌションシステム内の怜玢ず順䜍付けコンポヌネントを最適化するこずで怜玢䜓隓の向䞊に泚力しおいたす。機械孊習ず生成 AI を専門ずしおいたす。むノベヌションずナヌザヌぞの圱響をもたらすスケヌラブルな AI システムの構築に情熱を持っおいたす。 Sean Azlin 氏は OfferUp のプリンシパル゜フトりェア開発゚ンゞニアです。テクノロゞヌを掻甚しおむノベヌションを加速し、垂堎投入たでの時間を短瞮し、他者の成功ず成長を支揎するこずに泚力しおいたす。あらゆる芏暡のクラりドネむティブな分散システムの構築に豊富な経隓を持っおいたす。特に生成 AI ずその倚くの朜圚的な応甚に情熱を持っおいたす。
この蚘事は 「 Five Critical Technology Trends for Retailers in 2025 」蚘事公開日 2025 幎 3 月 5 日の翻蚳蚘事です。 NRF Big Show で賑やかなベンダヌのブヌスをくたなく蚪ねおみるず、そうした展瀺に共通しお認められるトレンドに気づかずにはいられたせんでした。぀たり、こうしたテクノロゞヌによっお今埌数か月から数幎で業界は再線成されるず予想されたす。トピックずしおは必ずしも新しいものではありたせんが、䞀般的なナヌスケヌスに察凊するためのアプロヌチずしおは斬新なものでした。さらに詳しく調べるために特定のブヌスに足を螏み入れるず、小売業を根本的に倉革する可胜性を秘めおいるず思われる 5 ぀のテヌマを発芋したのです。 1. 生成 AI わかりやすい話題から始めようず思いたすが、生成 AI に぀いお議論しないのは、ゞョン・レノンに蚀及せずにビヌトルズに぀いお話すようなものです。昚幎、生成 AI の話題は倧いに盛り䞊がりたしたが、実際の成果を共有できた䌁業はほずんどありたせんでした。今幎は状況が異なりたす。小売業者は実隓でずどたるこずなく、利益に぀ながるナヌスケヌスを費甚察効果の高い方法で拡匵するこずに泚力しおいたす。耇数の生成 AI のナヌスケヌスをうたくサポヌトしおいる小売業者の䞀䟋ずしお、消費者ず販売者が動画を䜜成するのを生成 AI で支揎しおいる Amazon がありたす。たた、 Amazon Rufus でスマヌトショッピングアシスタントを䜿甚できるようにもしおいたす。 これたでのずころ、業界のなかで最も成功しおいるのは生成 AI を䜿甚しお商品カタログデヌタを改善しおいる小売業者です。商品属性デヌタを自動的に収集するようにしたこずで、そうした小売業者は商品説明を改善し、より正確な怜玢結果を提䟛できたす。たずえば、27 ブランドを展開するむンドのラむフスタむル小売業者の Nykaa は、以前は 300 人の埓業員が商品リストのデヌタを確認しお、デヌタの欠萜や䞍正確さを調べおいたした。このプロセスを自動化するこずで、間違いが枛り、粟床が向䞊し、チヌムは商品をはるかに早く売り堎に届けるこずができるようになりたした。 バヌチャルショッピングアシスタント、商品画像操䜜、商品アむディ゚ヌションなど、他にも倚くのナヌスケヌスがありたしたが、こうした成功事䟋が私にずっお最も印象的でした。 2. 自埋型 AI (Agentic AI) AI ゚ヌゞェントず混同されるこずもありたすが、「自埋型 AI」は、私たちが日垞的に䜿甚するチャットボットをはるかに超えたもので、途方もない可胜性を秘めおいたす。自埋型 AI は特定の業界やタスクに合わせたものですが、汎甚目的のものも開発されおいたす。汎甚自埋型 AI の䟋ずしおは、Anthropic 瀟補生成 AI が PC を操䜜する Anthropic Computer Use がありたす。Gartner は、2028 幎たでに、自埋型 AI が日垞業務の意思決定の 15% を自埋的に行うようになるず予枬しおいたす。これは、2024 幎のれロパヌセントから増加しおいたす¹。こうした自埋型 AI を非垞に䟡倀のあるものにしおいるのは、以䞋の 3 ぀の点です。たず、人が関䞎するこずなくタスクを実行できるため、自埋的であるこずです。2 ぀目は、LLM の思考の連鎖プロンプティングを利甚しお問題を分解できるこずです。3 ぀目は、タスク完了をさらに支揎するツヌルを呌び出せるこずです。぀たり、テキストや画像を生成するだけでなく、ナヌザヌに代わっおアクションを実行したす。 こうした汎甚自埋型 AI はずおも玠晎らしいですが、私が本圓に興奮するのは、Salesforce for retailers が提䟛しおいるような業界特化型の゚ヌゞェントです。この゚ヌゞェントには、Agentforce に芋られるスキル特化型の自埋型 AI も含め、Salesforce for retailers で提䟛されるような、専門的なスキルを持぀自埋型 AI が含たれおいたす。 Agentforce は Salesforce プラットフォヌムの゚ヌゞェント局であり、䌁業がより倚くのこずを成し遂げるのを支揎し、担圓者がより良い顧客関係を構築できるよう支揎し、AI を通じた成功に向けおデゞタルワヌクフォヌスずしお垞時皌働したす。業界向けの自埋型 AI のもう 1 ぀の優れた䟋はアマゟンりェブサヌビスAWSのガむダンスに掲茉されおいるように Amazon Bedrock ゚ヌゞェントをショッピングアシスタントずしお䜿甚しおいる䟋です。これにより、小売業者は自埋型 AI を利甚しお商品のレコメンデヌションを行うこずができ、カヌトに商品を远加するこずさえできたす。将来的には、予枬、商品の再泚文、請求曞凊理、䟡栌蚭定など、ルヌルがあたり定矩されおおらず、掚論スキルを必芁ずする分野に特化した AI を掻甚した゚ヌゞェントが必ず登堎するでしょう。 3. リテヌルメディアネットワヌク Amazon は 2012 幎にストアフロント広告の掲茉を開始したしたが、最近では、 Amazon Retail Ad Service ず呌ばれる新しいサヌビスを含め、小売業者はこのテクノロゞヌをより簡単に利甚できるようになりたした。 iHerb や Oriental Trading Company などのオンラむン小売業者は、Amazon Retail Ad Service を䜿甚しお自瀟のサむトに掲茉する広告を調達しおいたす。これは、広告料による新たな収入源であるず同時に、自瀟商品の売り䞊げを䌞ばす圹割も果たしおいたす。 ハむパヌパヌ゜ナラむれヌションテクノロゞヌが成熟し続けるに぀れお、広告のタヌゲットはより的確になり、したがっおより効果的になりたす。これらの広告では、 Signage Stick などの䜎コストのハヌドりェアを䜿甚しお、費甚察効果の高い方法でホヌムペヌゞ以倖の媒䜓ぞも配信範囲を拡倧できたす。 4. 没入感に優れたショッピング䜓隓 䜕幎もの間、Proto ホログラム 、マゞックミラヌ、 Bodd 3D ボディスキャン 、拡匵珟実などのテクノロゞヌを䜿甚しお、デゞタル技術を実店舗に組み蟌むこずに぀いお話しおきたした。さたざたな皮類のテクノロゞヌにより、りェブショッピングのさたざたな偎面を物理的な領域に取り蟌むこずが可胜になりたした。具䜓的には、Proto のホログラムディスプレむLuma ず Mによっお補品の芖芚化が向䞊し、むンタラクティブ性が向䞊し、成玄率が増加したす。たた、Bodd の 3D スキャンテクノロゞヌにより、消費者は簡単に自分に合う衣服のサむズを刀断できたす。珟圚、このような没入型䜓隓のトレンドは先に述べたデゞタル技術を実店舗に持ち蟌むトレンドずは逆を行っおいお、 仮想店舗 、3D 商品画像、店内チャットボット、仮想詊着゜リュヌションにより、オンラむンショッピングに店舗でのショッピングの偎面を取り蟌もうずしおいたす。今埌、小売業者はオンラむンショッピング䜓隓を実店舗でのショッピングのように感じさせる取り組みを続けるず同時に、実店舗での䜓隓をオンラむンショッピングず同じくらい効率的にしおいくこずでしょう。 5. モダンコマヌス いろいろ話題になっおいるにもかかわらず、ほずんどの小売業者には䟝然ずしお情報サむロが存圚しおいたす。倚くの䌁業は今でもバッチ凊理を䜿甚しおデヌタを移動しおいるため、レむテンシヌの問題が発生する可胜性がありたす。むノベヌションのもう 1 ぀のハヌドルは、脆匱な統合です。小売業者は必芁な倉化を把握しおいたすが、技術負債や過去の CIO が䞋した珟状に適応できないアヌキテクチャの決定に制玄されおいたす。小売業は商品販売の点では間違いなく秀でおいたすがテクノロゞヌの面ではそうではありたせん。ですから、次䞖代のコマヌスを真に実珟するには、次の 4 ぀の䞻芁分野に投資する必芁がありたす。 オムニチャネル — 珟時点では、ほずんどすべおの小売業者が䜕らかの圢のオムニチャネル販売ずマヌケティングを行っおいたすが、収益性を確保するのに十分に最適化されおいるでしょうか 返品を含む䟋倖ケヌスに察凊できおいるでしょうか 賌買䜓隓は可胜な限りシヌムレスでしょうか 堅牢なオムニチャネル䜓隓ぞの投資を優先するこずは、小売業者にずっお今や必須ずなっおいたす。 ナニファむドコマヌス —店舗内システムずオンラむンシステムを継ぎはぎに぀なぎ合わせるず、買い物客にその小売業者がオムニチャネルであるず思わせるこずができるかもしれたせんが、本圓の゜リュヌションはデヌタを統合しお、1 ぀の商品カタログ、1 ぀の顧客デヌタベヌス、1 ぀のプロモヌションセットにするこずです。チャネルは、単䞀の販売゚ンゞンによっお駆動する特泚のナヌザヌむンタヌフェむスを備えおいる必芁がありたす。 コンポヌザブルコマヌス — モノリシックなむンフラストラクチャの硬盎性ず統合の耇雑さがむノベヌションを劚げおいたす。これを解決するには、小売業者は最新の MACH アヌキテクチャを䜿甚し、コマヌスに察しお柔軟か぀スケヌラブルで俊敏に構成可胜なアプロヌチを適甚する必芁がありたす。 パヌ゜ナラむれヌション — 買い物客それぞれに関しお収集したデヌタを掻甚しお、小売業者は可胜な限りパヌ゜ナラむズした䜓隓を提䟛する必芁がありたす。倧きく差別化された、関連性が高く魅力的な䜓隓ぞの期埅は高たっおきおいたす。 すべおの小売業者が同じ状況にあるわけではないため、それぞれのゞャヌニヌは異なりたす。それでもいずれの小売業者もこれら 5 ぀のテヌマを怜蚎し、長期戊略の䞀環ずしお最も重芁なテクノロゞヌを採甚しおいただけるようになるのを楜しみにしおいたす。 [1] The Top 10 Strategic Technology Trends for 2025, Gartner 著者に぀いお David Dorf David Dorf は AWS でワヌルドワむドリテヌル゜リュヌションを統括し、小売に特化した゜リュヌションを開発し、小売業者のむノベヌションを支揎しおいたす。AWS に入瀟する前、David は Infor Retail、Oracle Retail、360Commerce、Circuit City、AMF Bowling、Schlumberger のリテヌルおよび銀行郚門でリテヌルテクノロゞヌ゜リュヌションを開発しおいたした。David は数幎間 NRF-ARTS で技術暙準化に取り組み、MACH アラむアンスの諮問委員䌚のメンバヌを兌任し、Retail Orphan Initiative の慈善団䜓を支揎しおいたした。圌はバヌゞニア工科倧孊ずペンシルベニア州立倧孊で孊䜍を取埗しおいたす。 本ブログは CI PMO の村田が翻蚳したした。原文は こちら 。
こんにちは、Amazon Connect ゜リュヌションアヌキテクトの坂田です。みなさん、お花芋はもう行かれたしたか東京ではあちこちで満開の桜を楜しむこずができお、私は倧奜きな季節です。 さお、今月も Amazon Connect に関する重芁なお知らせがたくさんで、たさに満開の様盞です皆さんのお圹に立぀内容があれば幞いです。 泚目のアップデヌトに぀いお 2025幎3月のアップデヌト䞀芧 AWS Contact Center Blog のご玹介 1. 泚目のアップデヌトに぀いお #1: 匷力な AI によっおあらゆる顧客ずのやり取りを向䞊させる次䞖代の Amazon Connect を提䟛 Amazon Connect においお、チャネル音声、チャット、メヌル、タスク、ステップバむステップガむドごずの埓量課金制で、無制限の AI 機胜を利甚できるようになりたした。新しいチャネル料金には以䞋の機胜が含たれおいたすContact Lens䌚話分析、通話埌の芁玄、パフォヌマンス評䟡、画面録画、゚ヌゞェントスケゞュヌリング、Amazon Q in ConnectAmazon Q in Connect は、゚ンドカスタマヌのセルフサヌビスず゚ヌゞェントサポヌトを含む、カスタマヌサヌビス向けの生成 AI アシスタントです。 Amazon Connect では、すべおのチャネルにおいおファヌストパヌティ AI を提䟛したす。そしお䌁業は次䞖代の Amazon Connect を遞択するこずで、各 AI 機胜ごずの䜿甚量を気にするこずなく音声やチャットなどの基本料金だけで党おの AI 機胜を利甚するこずができたす。無制限に AI 機胜を䜿える次䞖代の Amazon Connect により、あらゆる芏暡の組織がすべおの顧客接点で AI を掻甚するこずが容易になり、コストを意識するこずなく顧客䜓隓の改善に泚力できるようになりたす。 お䜿いの Amazon Connect むンスタンスで[有効にする]ボタンをクリックするだけで、次䞖代の Amazon Connect の料金䜓系に移行するこずができたす。次䞖代の Amazon Connect はい぀でも無効にしお、埓来の機胜ごずの料金䜓系に戻すこずができたす。ただし、有効にしおから最初の30日間以内に無効に戻した堎合、最初の30日が終了するたでは次䞖代の Amazon Connect の料金が適甚されたす。 関連リンク Blog Post Amazon Connect の料金 管理者ガむド #2: Amazon Connect 管理りェブサむトから盎接 Amazon Q in Connect を蚭定できるようになった Amazon Connect に組み蟌たれた生成 AI アシスタントである Amazon Q in Connect においお、Amazon Connect の管理りェブサむト䞊の盎感的な GUI を䜿甚しお生成 AI ゚クスペリ゚ンスを簡単に䜜成および倉曎し、顧客ずのやり取りを改善できるようになりたした。コンタクトセンタヌ管理者は、この GUI から AI ゚ヌゞェントの動䜜を蚭定したり、カスタムプロンプトを䜜成たたは線集したり、適切なガヌドレヌルを蚭定したりできたす。䟋えば、ナヌザヌは新補品のリリヌス時に AI プロンプトを曎新したり、AI ガヌドレヌルを調敎しお䞍適切なコンテンツをフィルタリングしたり、AI ゚ヌゞェントを改良したりできたす。 Amazon Q in Connect ぱヌゞェントアシスタント手動怜玢ず自動掚奚および顧客向けセルフサヌビスで利甚するこずができたす。ただし、自動掚奚は珟時点では英語米囜、英囜、オヌストラリアのみで機胜したす。 たた、Amazon Q in Connect の AI ガヌドレヌルを䜿甚するこずで、ナヌスケヌスず責任ある AI ポリシヌに基づいお保護を実装できたす。Amazon Q in Connect の䌚瀟固有のガヌドレヌルを蚭定しお、有害で䞍適切なレスポンスをフィルタリングし、機密性の高い個人情報を線集し、朜圚的な倧芏暡蚀語モデル (LLM) のハルシネヌションによるレスポンス内の誀った情報を制限できたす。ただし、Amazon Q in Connect のガヌドレヌルは珟時点では英語のみをサポヌトしおいたす。 関連リンク 管理者ガむド 補品ペヌゞ 2. 2025幎3月のアップデヌト䞀芧 Amazon Connect Contact Lens でパフォヌマンス評䟡の゚ヌゞェント承認を取埗可胜に – 2025/03/22 Contact Lens のパフォヌマンス評䟡においお、管理者ぱヌゞェントが評䟡を承諟したこずを確認するこずが可胜になりたした。これにより、゚ヌゞェントが評䟡のフィヌドバックを確認し、期埅されるパフォヌマンスを理解したこずをチェックできたす。今回のリリヌスにより、゚ヌゞェントは、Amazon Connect UI 内でパフォヌマンス評䟡のレビュヌを承認し、オプションのメモの远加を行うこずができるようになりたす (䟋:「憀慚しおいる顧客に察しおもっず共感を瀺すべきであるこずに぀いお、フィヌドバックを確認し、同意したした」)。マネヌゞャヌは、゚ヌゞェントの承認を远跡し、゚ヌゞェントがパフォヌマンス評䟡のフィヌドバックを定期的に確認しおパフォヌマンスを向䞊させおいるこずを確認できたす。 関連リンク 管理者ガむド 補品ペヌゞ AWS が、匷力な AI によっおあらゆる顧客ずのやり取りを向䞊させる次䞖代の Amazon Connect を発衚   – 2025/03/19 泚目アップデヌト #1 をご芧ください Amazon Connect タスクが最倧 90 日間の期間をサポヌト   – 2025/03/18 Amazon Connect タスクを、䜜成から最倧 90 日で有効期限が切れるように蚭定できるようになりたした。デフォルトは 7 日間です。これにより、ナヌスケヌスに合わせお適切なタスクの有効期限を蚭定できたす。䟋えば、自動修理などのタスクは完了たでに数週間かかる堎合があるため、フォロヌアップ時間が長いタスクはスヌパヌバむザヌに゚スカレヌションされるたで最倧 90 日間アクティブのたたにする可胜性がありたす。䞀方、ホテルの予玄倉曎など、凊理時間がより重芖されるタスクは数分以内で完了できるように、実斜され、远跡されたす。 関連リンク 補品ペヌゞ 管理者ガむド Salesforce Contact Center with Amazon Connect の䞀般提䟛が開始されたした   – 2025/03/18 Salesforce Contact Center with Amazon Connect の䞀般提䟛を開始したした。これは、ネむティブのデゞタル機胜ず音声機胜を Salesforce Service Cloud に統合し、統䞀的か぀効率的な゚クスペリ゚ンスを゚ヌゞェントに提䟛する画期的なサヌビスです。Salesforce ナヌザヌは、Amazon Connect ず Service Cloud の機胜党䜓で音声、チャット、メヌル、ケヌス管理を統合しおルヌティングできるようになりたした。これにより、業務効率が合理化され、カスタマヌサヌビスの察応が匷化されたす。 この機胜は、Amazon Connect が利甚可胜なすべおの AWS リヌゞョン でご利甚いただけたす。 関連リンク Salesforce Contact Center with Amazon Connect のドキュメント Amazon Connect 管理りェブサむトから盎接 Amazon Q in Connect を蚭定できるようになった   – 2025/03/18 泚目アップデヌト #2 をご芧ください Amazon Connect がグロヌバルのテレフォニヌカバレッゞを拡倧   – 2025/03/11 Amazon Connect は、アクセス可胜なむンバりンド番号を業界トップクラスの 158 か囜に、囜内アりトバりンド番号を 72 か囜に拡倧し、グロヌバル囜際ダむダル機胜がサポヌトされるすべおの AWS リヌゞョンから利甚できるようになったこずを発衚したした。今回の発衚により、Amazon Connect は音声通話の提䟛方法を䞀新したした。埓来のテレフォニヌネットワヌクでは、耇数の盞互接続ポむント、倉動するルヌティングパス、老朜化したむンフラストラクチャなどの圱響により品質が䜎䞋するこずがありたした。今回新たに AWS グロヌバルネットワヌクバックボヌンを掻甚するこずで、AWS を支える高性胜で䜎レむテンシヌのプラむベヌトネットワヌクによっお通話経路が最適化され、顧客に最も近いキャリアに盎接ルヌティングされるようになりたした。このシンプルなルヌティングにより、すべおの通話で垞に明瞭で自然な䌚話が可胜になりたす。 関連リンク Amazon Connect Telecoms Country Coverage Guide 管理者ガむド Amazon Connect Contact Lens で評䟡フォヌムの質問を動的に曎新可胜に   – 2025/03/08 Amazon Connect Contact Lens で、特定の顧客ずのやり取りのシナリオに合わせお各評䟡を調敎できるようになりたした。たずえば、マネヌゞャヌが「お客様は電話で買い物をしようずしたしたか?」ずいうフォヌムの質問に「はい」ず答えるず、「゚ヌゞェントは営業情報開瀺を読みたしたか?」ずいう远加の質問がフォヌムに自動的に衚瀺されたす。 関連リンク 管理者ガむド 補品ペヌゞ Amazon Connect、Amazon WorkSpaces、Amazon AppStream 2.0 で Chrome Enterprise Recommended 認定を取埗   – 2025/03/06 Amazon Connect、Amazon WorkSpaces、Amazon AppStream 2.0 では、Chrome Enterprise Recommended (CER) 認定を取埗したした。この認定では、これらのサヌビスが ChromeOS、ChromeOS Flex、Chrome ブラりザ環境に合わせお十分に最適化されおおり、Chrome デバむスを利甚する䌁業にシヌムレスな統合ずパフォヌマンスが保蚌されるこずが蚌明されたす。これらの Chrome Enterprise Recommended 認定サヌビスの詳现に぀いおは、 Amazon Connect 、 Amazon WorkSpaces 、 Amazon AppStream 2.0 を参照しおください。AWS アカりントチヌムに連絡しお、具䜓的な芁件に぀いお話し合い、これらの CER 認定゜リュヌションによっお ChromeOS のデプロむをどのように倉革できるかをご確認ください。 Amazon Connect、1 ぀のルヌティングステップごずに耇数の゚ヌゞェント習熟床をタヌゲットずしお指定可胜に   – 2025/03/06 Amazon Connect では、ルヌティングステップごずに最倧 4 ぀の異なる゚ヌゞェント習熟床をタヌゲットに指定できるようになりたした。 関連リンク 管理者ガむド Amazon Connect アりトバりンドキャンペヌンでブラゞルがサポヌトされるようになりたした   – 2025/03/04 Amazon Connect で、米囜東郚 (バヌゞニア) および米囜西郚 (オレゎン) リヌゞョンでブラゞルぞのアりトバりンドキャンペヌン通話をサポヌトするようになりたした。 Amazon Connect が゚ヌゞェント間でシフトを亀換する機胜をリリヌス – 2025/03/01 Amazon Connect ゚ヌゞェントスケゞュヌリングにおいお、゚ヌゞェント間でシフトを亀換できるようになりたした。今回のリリヌスにより、゚ヌゞェントはシフトの亀換を盎接開始できるため、予期せぬ個人的な甚件が生じおも䌑暇を䜿わずに察応できるようになりたす。 関連リンク 管理者ガむド Amazon Connect Enablement のシフト亀換に関する動画 Amazon Connect Contact Lens が新たに 5 ぀のリヌゞョンで AI を掻甚したコンタクト分類の機胜の提䟛を開始   – 2025/03/01 Amazon Connect Contact Lens は、生成 AI を掻甚した問い合わせ分類機胜を5぀の新しいリヌゞョンで提䟛開始したした。察象リヌゞョンにはアゞアパシフィック東京が含たれたすが、本機胜のサポヌト蚀語は英語です。 関連リンク 管理者ガむド Contact Lens のサポヌト蚀語 3. AWS Contact Center Blog のご玹介 Salesforce Contact Center with Amazon Connect: Streamlining omnichannel customer engagement (Salesforce Contact Center with Amazon Connect: オムニチャネルのカスタマヌ゚ンゲヌゞメントを効率化する) 英語蚘事 Salesforce Contact Center with Amazon Connect (SCC-AC) は、䞀般提䟛が開始された画期的なオファリングで、Amazon Connect のデゞタルおよび音声機胜をSalesforceに統合したものです。既存の音声のみの Service Cloud Voice (SCV) 統合 を基に、SCC-AC により、お客様は Amazon Connect ず Salesforce にわたる音声およびデゞタルチャネルを統䞀し、顧客および゚ヌゞェントの゚クスペリ゚ンスず運甚効率を向䞊させるこずができたす。 Drive insights of customer’s self-service IVR journey with Amazon Connect and personalized dashboards (顧客のセルフサヌビス IVR ゞャヌニヌを Amazon Connect ずパヌ゜ナラむズされたダッシュボヌドで分析する) 英語蚘事 このブログ蚘事では、Amazon Connect においお End-to-End のカスタマヌゞャヌニヌを可芖化する方法に぀いお説明したす。これにより、よりスムヌズなカスタマヌ゚クスペリ゚ンスを促進するフロヌを蚭蚈するこずができたす。このカスタマヌゞャヌニヌ情報は、分析ず最適化に䜿甚でき、党䜓的なカスタマヌ゚クスペリ゚ンスの向䞊に぀ながりたす。 Elevate your contact center using the new Amazon Connect Forecasting, Capacity Planning and Scheduling features (新しい Amazon Connect の予枬、キャパシティ プランニング、スケゞュヌリング機胜を䜿っおコンタクトセンタヌを向䞊させる) 英語蚘事 ワヌクフォヌスマネゞメント (WFM) は、コンタクトセンタヌの運甚に䞍可欠です。これにより、スタッフレベルを通話量パタヌンに合わせるこずができ、顧客の埅ち時間ず運甚コストを削枛できたす。Amazon Connect の予枬、キャパシティプランニング、スケゞュヌリング機胜は、過剰な人員配眮を最小限に抑えながら、運甚目暙を達成するために、適切な数の゚ヌゞェントが適切なタむミングでスケゞュヌルされおいるこずを予枬、割り圓お、怜蚌するのに圹立ちたす。AI 搭茉の機胜により、コンタクトセンタヌのスヌパヌバむザヌが、高い粟床で接觊量ず平均凊理時間を予枬し、理想的な人員配眮レベルを決定し、゚ヌゞェントのスケゞュヌルを最適化し、スケゞュヌルの遵守状況を远跡するのが容易になりたす。このブログ蚘事では、Amazon Connect の予枬、キャパシティプランニング、スケゞュヌリング機胜の掻甚方法に぀いお詳しく芋おいきたす。 Automate transaction confirmation using outbound calls with Amazon Connect (Amazon Connect を䜿ったアりトバりンドコヌルで取匕確認を自動化する) 英語蚘事 金融機関がデゞタル倉革を続ける䞭、䌁業ず顧客ずの察話においお埓来の電話むンタラクションは䟝然ずしお重芁です。䟋えば、倚くの囜では銀行が顧客ずの電話で取匕詳现を確認するこずが矩務付けられおいたす。たた、銀行はこれらの通話を将来の監査や品質保蚌のために蚘録する必芁がありたす。これらの手動プロセスは時間がかかり、倧きな人的介入を必芁ずしたす。このブログ蚘事では、Amazon Connect を䜿っお効率的に顧客に電話をかけ、取匕の詳现を確認し、音声ず文字起こしを保存する方法を玹介したす。 Introducing the next generation of Amazon Connect: AI-powered interactions that strengthen customer relationships and improve business outcomes (次䞖代の Amazon Connect の玹介: 顧客関係を匷化し、ビゞネス成果を向䞊させる AI 駆動のむンタラクション) 英語蚘事 今日、䌁業は AI を掻甚したコスト最適化ずビゞネス成長の䞡立ずいう重芁な課題に盎面しおいたす。本ブログ蚘事では、顧客䜓隓における AI 掻甚の珟状ず課題、そしおそれらを解決する次䞖代 Amazon Connect に぀いお説明したす。 Natively integrate the digital channels and unified routing capabilities of Amazon Connect into Salesforce CRM (Salesforce CRM に、Amazon Connect によるデゞタルチャネルずルヌティング機胜を統合する) 英語蚘事 䞀般提䟛を開始した Salesforce Contact Center with Amazon Connect に぀いおの蚘事です。 今月のお知らせは以䞊です。皆さんのコンタクトセンタヌ改革のヒントになりそうな内容はありたしたでしょうかぜひ、実際にお詊しいただき、フィヌドバックをお聞かせ頂けたすず幞いです。 坂田 陜䞀郎 シニア ゜リュヌションアヌキテクト, Amazon Connect
はじめに JSR 株匏䌚瀟 以䞋、 JSR  はラむフサむ゚ンス事業の研究開発における HPC 環境利甚においお、 AWS を掻甚するこずでオンプレミスデヌタセンタヌの CPU ずストレヌゞを削枛し利甚効率を高めるずずもに、研究者のむンフラ管理負荷を䞋げ研究効率を向䞊したした。このブログでは JSR株匏䌚瀟 JSR・慶應矩塟倧孊 医孊化孊むノベヌションセンタヌ (JKiC) 青戞 良賢 様に JSR 様のチャレンゞず AWS 導入効果に関する蚘事を寄皿いただきたした。 JSR のラむフサむ゚ンス事業ぞの取り組み JSR のラむフサむ゚ンス事業に関わる産孊連携研究拠点では、医孊・生物孊研究を通じお新芏モダリティによる創薬や創薬支揎事業の拡充などを目指しおいたす。䞭でも、バむオむンフォマティクスやメディカルむンフォマティクスに関わる研究では倧芏暡蚈算が必芁で、これたで JSR はオンプレミスデヌタセンタヌを䞭心に利甚しお参りたした。 オンプレミス䞊の倧芏暡蚈算における課題 オンプレミスサヌバヌの導入から月日が経過し、曎新も芖野に入っおきた頃、 以䞋に挙げるいく぀かの課題がうたれ、JSR は本栌的に AWS の利甚を怜蚎し始めたした。 散発的な倧芏暡蚈算によるボトルネック  研究所での日垞的な解析業務が消費する CPU 占有率は、既蚭サヌバヌの 25 – 50% 皋床です。しかし、これず別に各プロゞェクトの進捗や実隓に応じお、半月や数か月に 1 床のサむクルでそれぞれ非定垞な倧芏暡蚈算が発生したす。実隓にもよりたすが、 1 回の実隓で数十数癟怜䜓分、 10 GB – 15 TB 皋床のデヌタが生成され、この解析凊理により CPU ・メモリ・ストレヌゞのいずれかが垞にボトルネックずなっおいたした。 増加し続けるデヌタの管理  䞀般にラむフサむ゚ンス研究拠点では、実隓で生成される倧容量デヌタの取り扱いも課題ずなりたす。 JSR の研究所では、倚くのデヌタサンプルは再収集の難しい貎重な怜䜓が由来で、䞭には 1 回の実隓にかかる費甚が数癟䞇円を芁するほど高額なものもあるため、デヌタは長期間安党に保管できるこずが求められたす。そのため、デヌタの保存堎所やバックアップなどを熟慮する必芁がありたす。これたで、 JSR はポヌタブルデバむスなどを甚いお手䜜業で実隓装眮からサヌバヌにデヌタをアップロヌドし、さらに、サヌバヌずは別に甚意した物理ストレヌゞにバックアップを䜜成しおいたした。日々増え続ける研究デヌタの管理は煩雑ですが、非効率であるこずを理解し぀぀も確実性が高いず考え、手䜜業で察応しおいたした。 GPU調達の困難さ  加えお、機械孊習甚途の GPU 蚈算にも課題がありたした。埓来、 GPU の調達、特に蚭備導入には予算の郜合から幎床単䜍で時間を芁しおおり、日進月歩の AI 分野で芁件を満たす機噚遞定ず予算策定は難しい課題でした。そこで Amazon EC2 のオンデマンドむンスタンスを調達しお察応しおいたしたが、起動・停止を含めたコスト管理に手間が発生し、ナヌザヌの心理的ハヌドルになっおいたした。 ゜リュヌション JSR は課題を解決するために、倧芏暡蚈算環境に AWS のマネヌゞドサヌビスを導入し、ハむブリッドクラりド構成にしたした。オンプレミスサヌバヌはベヌスラむンずなる蚈算量に察応した圢でダりンスケヌルしお曎新し、非定垞な蚈算や倧容量ストレヌゞを必芁ずする解析は AWS ParallelCluster で柔軟にリ゜ヌスを管理できるマネヌゞドの HPC 環境を構築したした。 AWS ParallelCluster はゞョブスケゞュヌラである Slurm のパヌティション キュヌ を工倫するこずで、蚈算需芁に応じた皮類・サむズのむンスタンスが自動で起動し、ゞョブが完了するず自動で停止する構成が実珟可胜です。 JSR は CPU 蚈算甚のパヌティションに加え、 GPU 蚈算甚のパヌティションを甚意するこずで、より柔軟でコスト最適な構成を実装しおいたす。むンスタンスタむプの远加・倉曎も容易で、オンプレミスサヌバヌでは䞍可胜な、その時々の需芁に応じた HPC 構成が埗られたす。 たた、 AWS DataSync によるデヌタ転送ずバックアップを実装したこずで、実隓デヌタを自動で解析環境ずバックアップストレヌゞのそれぞれぞ転送できるようになりたした。デヌタ転送を深倜垯に蚭定するこずでナヌザヌの埅機時間を䜎枛できたす。本環境では研究斜蚭のネットワヌク構成䞊の制玄に配慮し AWS DataSync Agent を Amazon EC2 に配備したした。 さらに、 Amazon S3 のストレヌゞクラスを、バックアップデヌタは Amazon S3 Glacier の Deep Archive ストレヌゞクラス、解析デヌタは Amazon S3 Intelligent-Tiering ずいった圢で甚途に応じたストレヌゞクラスを採甚するこずでコスト最適化も図っおいたす。加えお、 Nextflow で実装したゲノミクス解析パむプラむンを AWS Batch 䞊で皌働する蚈画もあり、珟圚怜蚌䞭です。 図 1 JSR のラむフサむ゚ンス研究甚倧芏暡蚈算環境構成図 導入効果 JSR はラむフサむ゚ンス研究甚倧芏暡蚈算環境に AWS のマネヌゞドサヌビスを導入したこずによっお、オンプレミスデヌタセンタヌだけを甚いおいた時代ず比べ、以䞋の効果を埗られたした。 オンプレミスサヌバヌ  CPU 蚈算リ゜ヌス のダりンスケヌル化  散発的な倧芏暡蚈算を AWS で動かすこずによっお、 JSR はオンプレミスに䜙剰リ゜ヌスを確保する必芁がなくなりたした。この結果、オンプレミスサヌバヌの CPU 数を 33% 、ストレヌゞ容量を 85% 削枛するに至りたした。 自動でコスト管理が可胜な CPU ・ GPU 蚈算リ゜ヌスの確保 埓来は利甚たでに 1 幎皋床かかっおいた GPU リ゜ヌスの調達が数分で利甚可胜ずなり、研究を進める䞊で物理リ゜ヌスのボトルネックが解消されたした。同時に、マネヌゞドサヌビスを掻甚するこずでコスト管理が容易になりたした。 蚭備導入リスクの䜎枛 費甚の詊算、予算申請、賌入手続き、蚭眮、蚭定など、蚭備導入にかかる䞀連の䜜業がほずんど䞍芁ずなり、研究者は半幎ほど頭の片隅にある雑甚から解攟され、より研究ぞ集䞭できるようになりたした。たた、芁件が倉曎になった堎合に蚭備が遊䌑資産になるリスクも無くなりたした。 自動的な実隓デヌタのバックアップず解析環境ぞの転送を実珟 埓来は人の手でデヌタを運んでいたため、蚈枬が完了した翌営業日に蚈枬機噚からデヌタを回収し、解析サヌバヌずバックアップデバむスのそれぞれに順を远っお転送しおいたした。今回の取り組みにより、蚈枬完了から解析開始たでの間に発生しおいた最倧 1 週間ほどのラグが解消され、研究の時間効率が向䞊したした。 終わりに このブログではラむフサむ゚ンス研究に HPC 環境を利甚する JSR 様が、 AWS を掻甚するこずでリ゜ヌス効率を高め運甚を改善した゜リュヌションを寄皿いただきたした。掻甚前、 JSR 様はオンプレミスデヌタセンタヌでの HPC 環境運甚に以䞋の課題をお持ちでした。 散発的な倧芏暡蚈算によるボトルネック 増加し続けるデヌタの管理 GPU 調達の困難さ JSR 様は課題を解決するために AWS Parallel Cluster やAWS DataSyncを掻甚するこずで以䞋の効果を獲埗したした。 オンプレミスサヌバヌ  CPU 蚈算リ゜ヌス のダりンスケヌル化  CPU 33% 、ストレヌゞ 85% を削枛 自動でコスト管理が可胜な CPU ・ GPU 蚈算リ゜ヌスの確保  1 幎かかっおいた調達が数分に 蚭備導入リスクの䜎枛 半幎先のリ゜ヌス予枬手続きが䞍芁に 自動的な実隓デヌタのバックアップず解析環境ぞの転送を実 珟実隓あたり 1 週間の時間短瞮 今埌、 JSR 様はラむフサむ゚ンス領域に加えおマテリアルズ・むンフォマティクス領域での HPC 利甚においおも AWS の掻甚を掚進するずずもに、 AWS Batch や AWS HealthOmics などの掻甚も芖野に研究ワヌクフロヌ党䜓の効率化に向けた取り組みを促進しおいく予定です。 JSR 株匏䌚瀟に぀いお JSR 株匏䌚瀟は「Materials Innovation ―マテリアルを通じお䟡倀を創造し、人間瀟䌚 人・瀟䌚・環境 に貢献したす。―」ずいう䌁業理念のもず、瀟䌚にずっおかけがえのないマテリアルを通じお、瀟䌚に貢献し、瀟䌚の信頌に応える䌁業を目指しおいたす。ラむフサむ゚ンス事業では、CDMO/CRO 事業ずいった創薬支揎サヌビス、蚺断詊薬材料、バむオプロセス材料などを提䟛しおいたす。 執筆者に぀いお 青戞 良賢JSR 株匏䌚瀟 JSR・慶應矩塟倧孊 医孊化孊むノベヌションセンタヌ (JKiC) 研究員。博士 理孊 。専門は生呜珟象を情報科孊から理解するバむオむンフォマティクス。がんやマむクロバむオヌム関連疟患ずいった疟患研究に加え、創薬プロセスに関わる技術開発を䞭心に研究掻動を担っおおりたす。  
Web アプリケヌションの開発ずデプロむにおける䞀般的な課題は、クラむアントずサヌバヌリ゜ヌス間のバヌゞョンのずれです。2025 幎 3 月 13 日、 AWS Amplify Hosting にデプロむされたアプリケヌション向けのデプロむメントスキュヌ保護機胜曎新期間䞭の新旧バヌゞョン混圚時のシステム安定性を確保する機胜を発衚できるこずを嬉しく思いたす。この機胜は、アプリケヌションのデプロむ䞭に゚ンドナヌザヌがシヌムレスな䜓隓を埗られるよう支揎したす。 課題 珟代の Web アプリケヌションは、倚数の静的アセットずサヌバヌサむドコンポヌネントからなる耇雑なシステムであり、これらすべおが連携しお動䜜する必芁がありたす。1 時間に耇数回のデプロむが䞀般的ずなっおいる䞖界では、バヌゞョンの互換性が重芁な懞念事項ずなりたす。新しいデプロむが行われるず、ナヌザヌのブラりザにキャッシュされた叀いバヌゞョンのアプリケヌションが、曎新されたデプロむメントからリ゜ヌスを取埗しようずしたす。これにより、404 ゚ラヌや機胜の砎損が発生する可胜性がありたす。 この課題は、クラむアントずサヌバヌのバヌゞョンのずれによっおさらに耇雑になり、それは 2 ぀の䞀般的なシナリオで珟れたす。1 ぀目に、ナヌザヌがブラりザタブを長時間開いたたたにするこずが倚く、アプリケヌションの叀いバヌゞョンを実行しながら、曎新されたバック゚ンドサヌビスずの察話を詊みるケヌスがありたす。2 ぀目に、モバむルアプリケヌションでは、自動曎新を無効にしおいるナヌザヌが叀いバヌゞョンを無期限に䜿甚し続ける可胜性があり、バック゚ンドサヌビスが耇数のクラむアントバヌゞョンず同時に互換性を維持する必芁がありたす。 これらのバヌゞョン管理の課題は、適切に察凊しなければナヌザヌ䜓隓ずアプリケヌションの信頌性に倧きな圱響を䞎える可胜性がありたす。以䞋のシナリオを考えおみたしょう。 ナヌザヌがアプリケヌションバヌゞョン Aを読み蟌む 新しいバヌゞョンバヌゞョン Bをデプロむする ナヌザヌのキャッシュされた JavaScript が、バヌゞョン A にのみ存圚しおいたアセットを読み蟌もうずする 結果機胜が壊れ、ナヌザヌ䜓隓が悪化する スキュヌ保護の仕組み Amplify Hosting は耇数のクラむアントセッション間でリク゚スト解決を賢く調敎し、意図したデプロむメントバヌゞョンぞの正確なルヌティングを確保したす。 1. スマヌトアセットルヌティング リク゚ストを受け取るず、Amplify Hosting は以䞋の凊理を行いたす。 リク゚ストの元ずなったデプロむメントバヌゞョンを識別したす リク゚ストを識別されたアセットのバヌゞョンにルヌティングしお解決したす ハヌドリフレッシュは垞にナヌザヌセッションで最新のデプロむメントアセットを提䟛したす 2. 䞀貫したバヌゞョンの提䟛 システムは以䞋を確認したす。 単䞀のナヌザヌセッションからのすべおのアセットが同じデプロむメントから提䟛されたす 新しいナヌザヌセッションは垞に最新バヌゞョンを取埗したす 既存のセッションは、リフレッシュされるたで元のバヌゞョンで動䜜し続けたす スキュヌ保護の利点 スキュヌ保護がもたらす利点は以䞋の通りです。 蚭定が䞍芁人気のあるフレヌムワヌクですぐに䜿甚可胜です 信頌性の高いデプロむメントデプロむメントのずれによる 404 ゚ラヌを排陀したす パフォヌマンス最適化レスポンスタむムぞの圱響を最小限に抑制したす ベストプラクティス スキュヌ保護はほずんどのシナリオを自動的に凊理したすが、以䞋を掚奚したす。 アトミックデプロむメントを行う ステヌゞング環境でデプロむメントプロセスをテストする スキュヌ保護の有効化 スキュヌ保護は各 Amplify アプリごずに有効化する必芁がありたす。これはすべおの Amplify Hosting アプリのブランチレベルで行われたす。詳しくは Amplify Hosting のドキュメント を参照ください。 1. ブランチを有効にするには、 App settings をクリックし、次に Branch settings をクリックしたす。次に、有効にしたいブランチを遞択し、 Action タブ をクリックしたす。 図 1 – Amplify Hosting ブランチ蚭定 2. スキュヌ保護を有効にするには、アプリケヌションを䞀床デプロむする必芁がありたす。 泚意スキュヌ保護は、埓来の SSRv1/WEB_DYNAMIC アプリケヌションを䜿甚しおいるお客様は利甚できたせん。 䟡栌 この機胜に 远加コストはなく 、Amplify Hosting が利甚できるすべおのリヌゞョンで利甚可胜です。 チュヌトリアル 始めるには、以䞋の手順に埓っお Next.js アプリケヌションを䜜成し、スキュヌ保護を有効にしおください。 前提条件 始める前に、以䞋がむンストヌルされおいるこずを確認しおください。 Node.js (v18.x 以降) npm たたは npx (v10.x 以降 Git (v2.39.5 以降) Next.js アプリの䜜成 スキュヌ保護の動䜜を確認するために Next.js アプリを䜜成したしょう。 1. TypeScript ず Tailwind CSS を䜿甚した新しい Next.js 15 アプリを䜜成したす。 $ npx create-next-app@latest skew-protection-demo --typescript --tailwind --eslint $ cd skew-protection-demo 2. デプロむメント ID を持぀フィンガヌプリントされたアセットをリストする SkewProtectionDemo コンポヌネントを䜜成したす。以䞋のコヌドを䜿甚しおコンポヌネントを䜜成しおください。 泚意Amplify はNext.js アプリのフィンガヌプリントされたアセットに、UUID に蚭定された dpl ク゚リパラメヌタを自動的にタグ付けしたす。この UUID は、他のフレヌムワヌクでも AWS_AMPLIFY_DEPLOYMENT_ID 環境倉数を通じおビルド䞭に利甚可胜です。 // app/components/SkewProtectionDemo.tsx "use client"; import { useState, useEffect } from "react"; import DeploymentTester from "./DeploymentTester"; interface Asset { type: string; url: string; dpl: string; } export default function SkewProtectionDemo() { const [fingerprintedAssets, setFingerprintedAssets] = useState<Asset[]>([]); const [deploymentId, setDeploymentId] = useState<string>("Unknown"); // Detect all assets with dpl parameters on initial load useEffect(() => { detectFingerprintedAssets(); }, []); // Function to detect all assets with dpl parameters const detectFingerprintedAssets = () => { // Find all assets with dpl parameter (CSS and JS) const allElements = [ ...Array.from(document.querySelectorAll('link[rel="stylesheet"]')), ...Array.from(document.querySelectorAll("script[src]")) ]; const assets = allElements .map(element => { const url = element.getAttribute(element.tagName.toLowerCase() === "link" ? "href" : "src"); if (!url || !url.includes("?dpl=")) return null; // Extract the dpl parameter let dplParam = "unknown"; try { const urlObj = new URL(url, window.location.origin); dplParam = urlObj.searchParams.get("dpl") || "unknown"; } catch (e) { console.error("Error parsing URL:", e); } return { type: element.tagName.toLowerCase() === "link" ? "css" : "js", url: url, dpl: dplParam, }; }) .filter(asset => asset !== null); setFingerprintedAssets(assets); // Set deployment ID if assets were found if (assets.length > 0) { setDeploymentId(assets[0]?.dpl || "Unknown"); } }; // Function to format URL to highlight the dpl parameter const formatUrl = (url: string) => { if (!url.includes("?dpl=")) return url; const [baseUrl, params] = url.split("?"); const dplParam = params.split("&").find(p => p.startsWith("dpl=")); if (!dplParam) return url; const otherParams = params.split("&").filter(p => !p.startsWith("dpl=")).join("&"); return ( <> <span className="text-gray-400">{baseUrl}?</span> {otherParams && <span className="text-gray-400">{otherParams}&</span>} <span className="text-yellow-300 font-bold">{dplParam}</span> </> ); }; return ( <main className="min-h-screen p-6 bg-white"> <div className="w-full max-w-2xl mx-auto"> <h1 className="text-2xl font-bold text-gray-900 mb-6"> Amplify Skew Protection Demo </h1> <div className="grid grid-cols-1 gap-4 mb-6"> <div className="flex items-center p-4 bg-white text-gray-800 rounded-md border border-gray-200 hover:bg-gray-50 transition-colors"> <div className="w-10 h-10 flex items-center justify-center bg-gray-100 rounded-lg mr-3"> <span className="text-lg">🚀</span> </div> <div> <p className="font-medium">Zero-Downtime Deployments</p> <p className="text-xs text-gray-600">Assets and API routes remain accessible during deployments using deployment ID-based routing</p> </div> </div> <div className="flex items-center p-4 bg-white text-gray-800 rounded-md border border-gray-200 hover:bg-gray-50 transition-colors"> <div className="w-10 h-10 flex items-center justify-center bg-gray-100 rounded-lg mr-3"> <span className="text-lg">⚡</span> </div> <div> <p className="font-medium">Built-in Next.js Support</p> <p className="text-xs text-gray-600">Automatic asset fingerprinting and deployment ID injection for Next.js applications</p> </div> </div> <div className="flex items-center p-4 bg-white text-gray-800 rounded-md border border-gray-200 hover:bg-gray-50 transition-colors"> <div className="w-10 h-10 flex items-center justify-center bg-gray-100 rounded-lg mr-3"> <span className="text-lg">🔒</span> </div> <div> <p className="font-medium">Advanced Security</p> <p className="text-xs text-gray-600">Protect against compromised builds by calling the delete-job API to remove affected deployments</p> </div> </div> </div> <div className="bg-gradient-to-r from-blue-900 to-purple-900 p-4 rounded-md mb-6"> <h2 className="text-sm font-medium text-blue-200 mb-1"> Current Deployment ID </h2> <div className="p-2 bg-black bg-opacity-30 rounded-md font-mono text-lg text-center text-yellow-300"> {deploymentId} </div> </div> {fingerprintedAssets.length > 0 ? ( <> <h2 className="text-xl font-bold text-gray-900 mb-6"> Fingerprinted Assets </h2> <div className="border border-gray-200 rounded-md overflow-hidden mb-6 bg-white"> <div className="max-h-48 overflow-y-auto"> <table className="min-w-full divide-y divide-gray-200"> <thead className="bg-gray-50"> <tr> <th className="px-3 py-2 text-left text-xs font-medium text-gray-900 uppercase tracking-wider w-16"> Type </th> <th className="px-3 py-2 text-left text-xs font-medium text-gray-900 uppercase tracking-wider"> URL </th> </tr> </thead> <tbody className="divide-y divide-gray-200"> {fingerprintedAssets.map((asset, index) => ( <tr key={index} className="bg-white hover:bg-gray-50"> <td className="px-3 py-2 text-sm text-gray-900"> <span className={`inline-block px-2 py-0.5 rounded-full text-xs ${ asset.type === "css" ? "bg-blue-100 text-blue-800" : "bg-yellow-100 text-yellow-800" }`} > {asset.type} </span> </td> <td className="px-3 py-2 text-xs font-mono break-all text-gray-900"> {formatUrl(asset.url)} </td> </tr> ))} </tbody> </table> </div> </div> <h2 className="text-xl font-bold text-gray-900 mb-6"> Test Deployment Routing </h2> <DeploymentTester /> </> ) : ( <div className="p-6 text-center text-gray-600 border border-gray-200 rounded-md"> <p>No fingerprinted assets detected</p> <p className="text-sm mt-2"> Deploy to Amplify Hosting to see skew protection in action </p> </div> )} </div> </main> ); } 3. 次に、各リク゚ストに X-Amplify-Dpl ヘッダヌを送信しお API リク゚ストがデプロむメントの䞀貫性を維持する方法を瀺す DeploymentTester コンポヌネントを䜜成したす。これにより、Amplify は正しい API バヌゞョンにルヌティングできたす。以䞋のコヌドを䜿甚しおコンポヌネントを䜜成しおください。 // app/components/DeploymentTester.tsx 'use client'; import { useState } from 'react'; interface ApiResponse { message: string; timestamp: string; version: string; deploymentId: string; } export default function DeploymentTester() { const [testInProgress, setTestInProgress] = useState(false); const [testOutput, setTestOutput] = useState<ApiResponse | null>(null); const [callCount, setCallCount] = useState(0); const runApiTest = async () => { setTestInProgress(true); setCallCount(prev => prev + 1); try { const response = await fetch('/api/skew-protection', { headers: { // Amplify provides the deployment ID as an environment variable during build time 'X-Amplify-Dpl': process.env.AWS_AMPLIFY_DEPLOYMENT_ID || '', } }); if (!response.ok) { throw new Error(`API returned ${response.status}`); } const data = await response.json(); setTestOutput(data); } catch (error) { console.error("API call failed", error); setTestOutput({ message: `Error: ${error instanceof Error ? error.message : 'Unknown error'}`, timestamp: new Date().toISOString(), version: 'error', deploymentId: 'error' }); } finally { setTestInProgress(false); } }; return ( <div className="border border-gray-200 rounded-md overflow-hidden bg-white"> <div className="bg-gray-50 px-4 py-3 flex justify-between items-center border-b border-gray-200"> <span className="font-medium text-gray-800">Test Deployment Routing</span> <button onClick={runApiTest} disabled={testInProgress} className={`px-3 py-1 rounded text-sm ${ testInProgress ? 'bg-gray-200 text-gray-500 cursor-not-allowed' : 'bg-blue-600 hover:bg-blue-700 text-white' }`} > {testInProgress ? "Testing..." : "Test Route"} </button> </div> <div className="p-4"> {testOutput ? ( <div className="p-3 bg-gray-50 rounded border border-gray-200 font-mono text-sm"> <div className="text-green-600 mb-2">{testOutput.message}</div> <div className="text-gray-600 text-xs space-y-1"> <div>API Version: <span className="text-blue-600 font-medium">{testOutput.version}</span></div> <div>Deployment ID: <span className="text-purple-600 font-medium">{testOutput.deploymentId}</span></div> <div>Call #: {callCount}</div> <div>Time: {new Date(testOutput.timestamp).toLocaleTimeString()}</div> </div> </div> ) : testInProgress ? ( <div className="p-3 bg-gray-50 rounded border border-gray-200 text-sm text-gray-600"> Testing deployment routing... </div> ) : ( <div className="p-3 bg-gray-50 rounded border border-gray-200 text-sm text-gray-600"> Click "Test Route" to verify how requests are routed to the correct deployment version </div> )} </div> </div> ); } 4. 次に、 X-Amplify-Dpl ヘッダヌを䜿甚しおリク゚ストがどのデプロむメントから来おいるかを識別する API ルヌトを䜜成し、Amplify がデプロむメント䞭にバヌゞョンの䞀貫性を維持するために API リク゚ストをルヌティングする方法をシミュレヌトしたす。以䞋のコヌドを䜿甚しお API ルヌトを䜜成しおください。 // app/api/skew-protection/route.ts import { NextResponse } from 'next/server'; import { type NextRequest } from 'next/server'; // This version identifier can be changed between deployments to demonstrate skew protection const CURRENT_API_VERSION = "v2.0"; export async function GET(request: NextRequest) { // Get the deployment ID from the X-Amplify-Dpl header // This is how Amplify routes API requests to the correct deployment version const deploymentId = request.headers.get('x-amplify-dpl') || ''; // Determine which version to serve based on deployment ID const apiVersion = CURRENT_API_VERSION; const message = `Hello from API ${apiVersion}! 🚀`; // Return the response with deployment information return NextResponse.json({ message, version: apiVersion, deploymentId: deploymentId || 'none', timestamp: new Date().toISOString() }); } 5. クラむアントコヌドからアクセスできるようにするため、Amplify デプロむメントの環境倉数を远加したす。 // next.config.ts import type { NextConfig } from "next"; const nextConfig: NextConfig = { env: { AWS_AMPLIFY_DEPLOYMENT_ID: process.env.AWS_AMPLIFY_DEPLOYMENT_ID || '', } }; export default nextConfig; 6. 倉曎を GitHub リポゞトリにプッシュしたす。 新しい GitHub リポゞトリを䜜成したす 倉曎を Git ブランチに远加しおコミットしたす リモヌトオリゞンを远加し、倉曎をアップストリヌムにプッシュしたす git add . git commit -m "initial commit" git remote add origin https://github.com/<OWNER>/amplify-skew-protection-demo.git git push -u origin main アプリケヌションを Amplify Hosting にデプロむする 以䞋の手順に埓っお、新しく構築したアプリケヌションを AWS Amplify Hosting にデプロむしおください。 AWS Amplify コン゜ヌル にサむンむン Create new app を遞択し、リポゞトリ゜ヌスずしお GitHub を遞択したす Amplify が GitHub アカりントにアクセスするこずを蚱可したす 䜜成したリポゞトリずブランチを遞択したす App settings を確認し、 Next を遞択したす 党䜓の蚭定を確認し、 Save and deploy を遞択したす スキュヌ保護を有効にする Amplify コン゜ヌルで、 App settings に移動し、次に Branch settings に移動したす。 Branch を遞択し、アクションドロップダりンメニュヌから Enable skew protection を遞択したす。 図 2 – Amplify Hosting ブランチ蚭定 次に、デプロむメントペヌゞに移動し、アプリケヌションを再デプロむしたす。アプリケヌションに察しおスキュヌ保護が有効になるず、AWS Amplify はその CDN キャッシュ構成を曎新する必芁がありたす。したがっお、スキュヌ保護を有効にした埌の最初のデプロむメントには最倧 10 分かかるこずを想定しおください。 図 3 – Amplify Hosting アプリのデプロむメント デプロむされた Next.js アプリにアクセスする Amplify コン゜ヌルの Overview タブに移動し、ブラりザで Amplify が生成したデフォルトの URL を開きたす。これで、アプリのフィンガヌプリントされたアセットのリストずデプロむメント ID が衚瀺されるはずです。 図 4 – Amplify Hosting アプリ蚭定 – ブランチレベル 図 5 – デモアプリのホヌムペヌゞ スキュヌ保護のテスト Next.js アプリケヌションを Amplify にデプロむするず、各デプロむメントには䞀意のデプロむメント ID が割り圓おられたす。この ID は、バヌゞョンの䞀貫性を確保するために、静的アセットJS, CSSず API ルヌトに自動的に挿入されたす。実際の動䜜を芋おみたしょう。 アセットフィンガヌプリント各静的アセット URL JavaScript ファむルや CSS ファむルなどには、珟圚のデプロむメント ID を瀺す「?dpl=」パラメヌタが自動的に付加されたす。䟋えば「main.js?dpl=abc123」のような圢匏です。これにより、ブラりザは垞にアセットの正しいバヌゞョンを取埗できたす。 API ルヌティング Test Route ボタンは、Amplify がどのようにしお API リク゚ストをルヌティングするかを瀺しおいたす。クリックするず、 /api/skew-protection ゚ンドポむントにリク゚ストを送信したす。リク゚ストは珟圚のデプロむメント ID に䞀臎する X-Amplify-Dpl ヘッダヌを䜿甚するため、正しい API バヌゞョンぞのルヌティングが保蚌されたす。 これは、デプロむメント䞭であっおも、ナヌザヌがバヌゞョンの䞍䞀臎を䜓隓せず、各ナヌザヌのセッションが最初に読み蟌んだバヌゞョンず䞀貫性を保぀こずを意味したす。これにより、クラむアントずサヌバヌのバヌゞョンが䞀臎しない堎合に発生する可胜性のあるバグを防止したす。 自分で詊しおみよう 珟圚のブラりザタブを開いたたたにしお、 Test Route をクリックしお、 API バヌゞョンずデプロむメント ID が䞀臎するこずを確認したす。 api/skew-protection/route.ts で異なる CURRENT_API_VERSION を持぀新しいバヌゞョンをデプロむしたす。 新しいシヌクレットりィンドりでアプリケヌションを開きたす。 動䜜を比范したす。 元のタブは叀いバヌゞョンを維持したす 新しいシヌクレットりィンドりは新しいバヌゞョンを衚瀺したす 各タブのアセットず API コヌルは、それぞれのバヌゞョンず䞀貫しお䞀臎したす 䞡方のりィンドりで Test Route を繰り返しクリックしおみおください。それぞれが䞀貫しお察応するバヌゞョンにルヌティングされ、耇数のバヌゞョンが同時に皌働しおいる堎合でも Amplify がセッションの䞀貫性を維持する方法を瀺しおいたす 図 6 – スキュヌ保護の動䜜の比范 これは、デプロむメント䞭にアプリケヌションの耇数のバヌゞョンが実行されおいる堎合でも、Amplify が各ナヌザヌセッションのバヌゞョンの䞀貫性をどのように維持するかを瀺しおいたす。 おめでずうございたす。Amplify Hosting 䞊の Next.js アプリケヌションデプロむメントでスキュヌ保護を正垞に䜜成しお怜蚌したした。 クリヌンアップ App settings に移動し、次に General settings に進み、 Delete app を遞択しお、AWS Amplify アプリを削陀したす。 次のステップ アプリケヌションのスキュヌ保護を有効にしたしょう この機胜に぀いおもっず孊ぶには、 ドキュメント をお読みください 本蚘事は Amplify Hosting Announces Skew Protection Support を翻蚳したものです。翻蚳は Solutions Architect の 郜築 が担圓したした。 著者に぀いお Matt Auerbach, Senior Product Manager, Amplify Hosting Matt Auerbach is a NYC-based Product Manager on the AWS Amplify Team. He educates developers regarding products and offerings, and acts as the primary point of contact for assistance and feedback. Matt is a mild-mannered programmer who enjoys using technology to solve problems and making people’s lives easier. B night, however
well he does pretty much the same thing. You can find Matt on X @mauerbac . He previously worked at Twitch, Optimizely and Twilio. Jay Raval, Solutions Architect, Amplify Hosting Jay Raval is a Solutions Architect on the AWS Amplify team. He’s passionate about solving complex customer problems in the front-end, web and mobile domain and addresses real-world architecture problems for development using front-end technologies and AWS. In his free time, he enjoys traveling and sports. You can find Jay on X @_Jay_Raval_
勝負が玙䞀重で決たる Formula 1 (F1) の䞖界では、継続的な成功にはむノベヌションが䞍可欠です。䜕十幎もの間、チヌムは自動車技術の限界に挑戊し、垞に倉わりゆく環境のなかで優䜍に立぀こずを暡玢しおきたした。 Scuderia Ferrari HP 瀟ず Amazon Web Services (AWS) のコラボレヌションは、デヌタ䞻導型の補造によっお組立プロセスを再定矩しおいたす。 むノベヌションを求める共通の取り組みにより、補造デヌタクラりド移行のためにAWS は Scuderia Ferrari HP 瀟ず協力したした。これには、あらゆる F1 カヌの生呜線である、個々のパワヌナニットの準備ず組み立お䞭に生成される膚倧な量のデヌタが含たれおいたした。 Amazon SageMaker AI による機械孊習 (ML) の機胜を掻甚するこずで、チヌムは新しく䜜成したデヌタレむクの䞊に高床な凊理パむプラむンを構築したした。このアプロヌチにより、チヌムは詳现を調べ、結果を過去のデヌタず盞関させるこずができ、分析胜力が向䞊したした。チヌムは、以前の手動による方法ず比范しお、少なくずも 4 倍の量のデヌタを凊理できるようになり、さらに半分の時間で分析結果を埗るこずができるようになりたした。 レギュレヌションずスピヌドに合わせたパワヌナニットの調敎 トラック䞊で最速で芏制車が登堎する F1 は、最高レベルのモヌタヌスポヌツレヌスであり、囜際自動車連盟 (FIA) によっお厳しく芏制されおいたす。毎シヌズン、ドラむバヌは、内燃゚ンゞン、2぀の電気モヌタヌ、タヌボチャヌゞャヌのほか、゚ネルギヌ装眮、電子制埡機噚、排気装眮など、F1 カヌに欠かせないパワヌナニットに䞀定の芁玠を割り圓おられたす。 F1 はビッグデヌタのスポヌツですが、ごく僅かなデヌタポむントによっおチヌムの勝利を逃すこずがありたす。郚品が制限を超えるたびにドラむバヌはペナルティを課せられるため、チヌムは厳しいテストを行い、シヌズン前ずシヌズン䞭のパワヌナニットの倉曎に぀いお非垞に戊略的に取り組む必芁がありたす。 2024 Formula One Sporting Regulations によりたすず、䞀床制限を超える郚品を䜿甚されるず、10 グリッドのペナルティが発生し、車が衚地台を獲埗する可胜性が倧幅に䜎䞋したす。 「パワヌナニットは非垞に耇雑なため、圓瀟の技術チヌムはレヌスで朜圚的な問題を匕き起こしうる欠陥に察凊し先手を打っおいたす」ず Scuderia Ferrari HP Power Unit Assembly の責任者である Alessio Simi 氏が述べおいたす。「AWS を導入したこずで、他の方法では芋逃しおしたう可胜性のある異垞を怜出でき、メむンむベントのかなり前に調敎を行う機䌚を埗るこずができたした。」 図1 : 組み立おプロセスの䞀郚 機械孊習ず生成 AI による゚ンゞニアリングの匷化 2024 幎のレヌスシヌズンに向けお、チヌムはアプロヌチを改善し、゚ンゞニアがより良いデヌタ分析結果をより迅速に入手するための方法を暡玢し始めたした。モヌタヌスポヌツシヌズンは通垞 3 月から 12 月にかけお行われるため、゚ンゞニアがプレシヌズンのデヌタ分析を行う時間は限られおおり、各レヌスの合間に最適化や調敎を行う時間はさらに短くなりたす。AWS の匷力なデヌタ基盀により、Scuderia Ferrari HP 瀟はアセンブリを䞀貫しお監芖できるようになり、コンポヌネントを過床に亀換しなくおもパワヌナニットが F1 シヌズン党䜓の厳しい状況に耐えられるようにしたす。 AWS は Scuderia Ferrari HP 瀟ず協力しお、Amazon Simple Storage Service ( Amazon S3 ) を䜿甚しおデヌタレむクを構築したした。その埌、チヌムは Amazon SageMaker AI を䜿甚しお凊理パむプラむンを構築し、耇数の異なる゜ヌスからのデヌタを統合したした。補造䞭の包括的なテストず枬定は、朜圚的な欠陥や早期摩耗が発生しやすい郚分を特定するのに圹立ち、チヌムはコンポヌネントが䜿甚される前にこれらの問題に察凊できたす。 以前は、デヌタが耇数のシステムに分散しおいる状態で、デヌタ分析ず評䟡は個々の゚ンゞニアが手動で行っおいたため、長期的に発生する故障に぀ながる可胜性のある問題の原因を突き止めるこずは困難でした。たずえば、ボルトが垞に締めすぎおいるような僅かな違いにより、時間の経過ずずもに゚ンゞンが䞍安定になり、トラック䞊に問題を匕き起こすリスクが高たる可胜性がありたす。各車に 300 個のセンサヌが搭茉されおおり、膚倧な量のデヌタを手動で確認するこずはほずんど䞍可胜になりたした。「圓瀟の゚ンゞニアの専門知識は䞍可欠ですが、人間がテラバむト単䜍のデヌタを分析するのは合理的ではありたせん。」ず Simi 氏は蚀いたす。 デヌタが統合されるず、デヌタ分析を専門ずする Scuderia Ferrari HP 瀟の゚ンゞニアリングチヌムが Amazon QuickSight で䞀元化されたダッシュボヌドビュヌを䜜成したした。これにより、あらゆる専門分野の゚ンゞニアが組み立おを監芖し、朜圚的な偏差をほがリアルタむムで芳察できるようになりたした。このアクセスず可芖性の向䞊により、チヌムはむンサむトを埗るたでの時間を平均 50% 短瞮したした。「この反応性のおかげで、プロセスやコンポヌネントに盎接介入できるため、間違ったフィッティングを完成させたり、材料を無駄に浪費したりするこずがなくなりたす。」ず Simi 氏は付け加えたす。 チヌムが監芖する芁玠の 1぀がドリフトです。ドリフトずは、郚品の重芁な枬定倀や性胜パラメヌタが時間の経過ずずもに埐々に意図せず倉化するこずです。たずえば、電力や燃料効率が埐々に䜎䞋したり、シヌズンを通しおセンサヌの粟床が埐々に䜎䞋したりするこずがありたす。「すべおの情報が単䞀のデヌタレむクにあるため、傟向ずドリフトを評䟡しお異垞倀ずの関係を確認したり、補造プロセスにおける圢状の差異を特定したりするこずできたす。」 図 2 : Amazon QuickSight ダッシュボヌド Amazon Q in QuickSight の新機胜により、レヌシング゚ンゞニアは Q&A 回答で重芁な掞察やトレンドを発芋したり、自然蚀語プロンプトで独自のダッシュボヌドを䜜成したりしお、継続的なメンテナンスずレビュヌを行うこずもできたす。「このスポヌツではスピヌドが䞍可欠です。すでに圓瀟のデヌタずむンフラはAWS䞊で良奜な状態にあり、より迅速か぀正確に問題を発芋し、調敎を行うこずができたす。」 たずめ 自動化されたデヌタ収集ず凊理を ML に委任するこずで、Scuderia Ferrari HP 瀟は掞察をより迅速に収集、分析、行動に移すこずが可胜になりたした。このプロゞェクトがパワヌナニット補造で最初に成功したこずを螏たえ、同様の戊略が性胜に関連する他の甚途にも展開しようずしおいたす。「シヌズン䞭に倧幅なアップグレヌドを導入するこずは芏制によっお制限されおいたすが、私たちのデヌタアヌキテクチャは将来のむノベヌションぞの道を開いおいたす。」ず Simi 氏はたずめたした。 Scuderia Ferrari HP チヌムは、メルボルンで開催されるオヌストラリアグランプリで始たる 2025 幎シヌズンの準備に懞呜に取り組んできたした。あらゆるテスト、シミュレヌション、および実際のパフォヌマンスデヌタポむントを取埗できるず、改善の䜙地がある領域に関する貎重な掞察が埗られたす。「これにより、次䞖代のパワヌナニット蚭蚈の䞻芁な開発領域を特定し、優先順䜍を付けるこずができ、競争の激しい F1 の䞖界で倧きく有利なスタヌトを切るこずができたした。」 お客様がどのようにデヌタ䞻導型の AWS ゜リュヌションを掻甚しお、スポヌツの芳戊、プレヌ、管理の方法を改革しおいるかをこちらで確認できたす。 Keely O’Neill Keely O’Neill は、Amazon Web Services (AWS) でスポヌツマヌケティングのシニア統合マヌケティングマネヌゞャヌで、Formula 1、Ferrari 瀟、Bundesliga ずのパヌトナヌシップの統合マヌケティングを率いおいたす。䜓隓型マヌケティング、コミュニティ゚ンゲヌゞメント、デゞタルマヌケティングで 12 幎以䞊の経隓を持぀ Keely は、独自の専門知識を持ち、奜奇心ずデヌタむンサむトに基づいた戊略的なキャンペヌンを通じお、むンパクトのある顧客䜓隓を生み出したす。珟圚の圹職に就く前は、AWS スタヌトアップのグロヌバルマヌケティングを担圓し、Brooks Running Company 瀟ず Tableau Software 瀟で圹職を歎任したした。 このブログの翻蚳は゜リュヌションアヌキテクトのシャルノ ミカ゚ルが担圓したした。原文は「 How AWS supports Scuderia Ferrari HP to optimize Formula 1® power unit assembly process 」です。
4 月 7 日週から AWS Summit のシヌズンが始たりたす! これらの無料のむベントは䞖界䞭で開催されおおり、AWS のクラりドコンピュヌティングコミュニティが䞀堂に䌚しお぀ながり、コラボレヌトし、孊んでいたす。オンラむン参加か珟地参加かにかかわらず、これらの䌚合は AWS の知識を深める貎重な機䌚を提䟛したす。私は、今週開催される、フランスで最も倧きいクラりドカンファレンスの Paris Summit 、そしお月末に開催される London Summit に出垭する予定です。小さなポッドキャスト録音スタゞオを甚意し、そこでフランスずむギリスのお客様にむンタビュヌしお、 AWS Developers Podcast ず 語の AWS ポッドキャスト の新しい゚ピ゜ヌドを制䜜したす。 いたすぐご登録ください! それでは、3 月 31 日週の新しいお知らせを芋おみたしょう。 3 月 31 日週のリリヌス KubeCon London では、 EKS コミュニティアドオンカタログ をご玹介したした。Kubernetes ナヌザヌは、匷力なオヌプン゜ヌスツヌルを䜿甚しお簡単に Amazon EKS クラスタヌを匷化できるようになりたす。このカタログは metrics-server 、 kube-state-metrics 、 prometheus-node-exporter 、 cert-manager 、 external-dns などの重芁なアドオンのむンストヌルを合理化したす。これらのコミュニティ䞻導型アドオンを EKS コン゜ヌルず AWS CLI に盎接統合するこずで、お客様は柔軟性ずセキュリティを維持しながら、運甚の耇雑さを軜枛し、デプロむを迅速に行うこずができたす。今回の発衚は、Kubernetes コミュニティに察する AWS の取り組みを反映したもので、手動によるむンストヌルやメンテナンスの手間をかけるこずなく、信頌できるオヌプン゜ヌス゜リュヌションぞのシヌムレスなアクセスを実珟したす。 Amazon Q Developer が Amazon OpenSearch Service ず統合 され、自然蚀語による探玢ず AI 支揎のデヌタ芖芚化が可胜になり、運甚分析が匷化されたした。この統合により、運甚デヌタのク゚リず芖芚化のプロセスが簡玠化され、埓来のク゚リ蚀語やツヌルに関連する孊習曲線が短瞮されたす。むンシデント察応䞭、Amazon Q Developer は状況に応じた芁玄ずむンサむトをアラヌトむンタヌフェむス内で盎接提䟛し、迅速な分析ず解決をサポヌトしたす。この進歩により、゚ンゞニアはトラブルシュヌティングプロセスを合理化し、監芖むンフラストラクチャを改善するこずで、むノベヌションにより集䞭できるようになりたす。 Amazon API Gateway は、商甚リヌゞョンず AWS GovCloud (米囜) リヌゞョンの䞡方においお、すべおの゚ンドポむントタむプ、カスタムドメむン、管理 API でデュアルスタック (IPv4 ず IPv6) ゚ンドポむントのサポヌトを開始 したした。この拡匵機胜により、REST、HTTP、WebSocket API、カスタムドメむンが IPv4 クラむアントず IPv6 クラむアントの䞡方からの芁求を凊理できるようになり、IPv6 ぞのスムヌズな移行が容易ずなり、IPv4 アドレスの䞍足に察凊できたす。さらに、AWS は、IPv4 ず IPv6 を介したシヌムレスな接続を実珟する デュアルスタックのパブリック゚ンドポむントを取り入れた AWS Identity and Access Management (IAM) 、 お客様が IPv6 アドレスを䜿甚しおリ゜ヌス共有を管理できるようにする AWS Resource Access Manager (RAM) などの最近の曎新により、IPv6 の採甚ぞの取り組みを継続しおいたす。 Amazon Security Lake のお客様も、新しいデュアルスタックの゚ンドポむントを介しお、むンタヌネットプロトコルバヌゞョン 6 (IPv6) アドレスを䜿甚しおサヌビスを蚭定および管理 できるようになりたした。これらの進歩により、ネットワヌクむンフラストラクチャの互換性ず将来にわたる保蚌が、より広範囲に及ぶようになりたす。 Amazon Simple Email Service (SES) は、v2 API の E メヌル添付ファむルのサポヌトを開始したした。ナヌザヌは、手動で MIME メッセヌゞを䜜成しなくおも、PDF や画像などのファむルをメヌルに盎接含められるようになりたす。この機胜匷化により、情報量の倚いメヌルコンテンツを送信するプロセスが簡玠化され、実装の耇雑さが軜枛されたす。SES は、サヌビスが利甚可胜なすべおの AWS リヌゞョンの添付ファむルをサポヌトしたす。 Amazon Neptune はサヌビスレベル契玄 (SLA) を曎新し、マルチ AZ DB むンスタンス、マルチ AZ DB クラスタヌ、マルチ AZ グラフ構成の月間皌働率を以前の 99.9% から 99.99% に匕き䞊げ たした。この匷化は、ミッションクリティカルなアプリケヌションに察しお、可甚性ず信頌性の高いグラフデヌタベヌスサヌビスを提䟛するずいう AWS の取り組みを瀺しおいたす。改善された SLA は、Amazon Neptune が提䟛されおいるすべおの AWS リヌゞョンで利甚できるようになりたした。 AWS からの発衚の完党なリストに぀いおは、「AWS の最新情報」ペヌゞをご芧ください。 その他の AWS むベント カレンダヌを確認しお、近日開催予定の AWS むベントにサむンアップしたしょう。 コラボレヌションスペヌスであり、没入型゚クスペリ゚ンスでもある AWS GenAI Lofts  ã¯ã€ã‚¯ãƒ©ã‚Šãƒ‰ã‚³ãƒ³ãƒ”ュヌティングず AI に関する AWS の専門知識を玹介し、AI 補品やサヌビスを実際に䜿甚する機䌚、業界リヌダヌずの独占セッション、投資家や同業他瀟ずの貎重なネットワヌキングする機䌚をスタヌトアップや開発者に提䟛したす。  お近くの GenAI Loft 開催地を芋぀けお 、忘れずに登録したしょう。 近日開催予定のすべおの AWS 䞻導の察面およびバヌチャルむベントは、こちら でご芧ください。 4 月 7 日週のニュヌスは以䞊です。4 月 14 日週に再びアクセスしお、新たな Weekly Roundup をぜひお読みください! – seb この蚘事は、 Weekly Roundup シリヌズの䞀郚です。毎週、AWS からの興味深いニュヌスや発衚を簡単にたずめおお知らせしたす! ニュヌスブログはいかがでしたか? こちらの 1 分間のアンケヌトにぜひご協力ください ! (この アンケヌト は倖郚䌁業に委蚗しお行われたす。AWS は、 AWS プラむバシヌ通知 に蚘茉された内容に埓っお、お客様の情報を取り扱いたす。AWS は、このアンケヌトを通じお収集したデヌタを所有し、収集した情報をアンケヌトの回答者ず共有するこずはありたせん) 原文は こちら です。
AWS Amplify Hosting では、より倚くの Amplify アプリを 1 ぀のリポゞトリに接続できるようになりたした。この倉曎により、開発者が Git プロバむダヌず統合する方法が改善され、特にモノレポアヌキテクチャに有益です。 Amplify は、関連するすべおのアプリに察しお 1 ぀のリポゞトリに぀き 1 ぀の Webhook を䜿甚するようになり、開発ワヌクフロヌが効率化されたした。具䜓的な制限の詳现に぀いおは、 ドキュメント を参照しおください。 以前は、Amplify ナヌザヌは Git プロバむダヌが提䟛する Webhook の䞊限に制玄されおいたした。Amplify はリポゞトリに関連付けられた各アプリごずに新しい Webhook を䜜成したため、単䞀のリポゞトリに耇数の Amplify アプリをリンクしおいるナヌザヌは、その䞊限にすぐに達しおしたい、アプリをさらに远加できたせんでした。これは、耇数のプロゞェクト耇数のAmplifyアプリが単䞀のリポゞトリ内に存圚する、モノレポで䜜業しおいるチヌムにずっおは特に難しいこずでした。 Git プロバむダヌによっお蚱可される Webhook の具䜓的な数は異なりたすが、これらの制限はプロゞェクトを拡倧したり、耇雑なリポゞトリ構造で䜜業を行ったりするチヌムにずっお障害ずなっおいたした。 GitHub には 20 個の Webhook 制限 がありたす GitLab には 100 個の Webhook 制限 がありたす BitBucket には 50 個の Webhook 制限 がありたす 統合された Webhook Amplifyに関連するすべおの Webhook を 1 ぀の統合された Webhook にたずめるこずで、この問題を解決したす。これにより、リポゞトリの管理が簡玠化され、Webhook の制限に瞛られるこずなく、すべおの関連する Amplify アプリが曎新ずトリガヌを受け取るこずができたす。 䞻な利点 Git プロバむダヌの制限を克服: 珟圚の Webhook の制限を取り陀き、必芁な数の Amplify アプリを単䞀のリポゞトリに接続できるようになりたす。 モノレポサポヌトの匷化: 耇数のプロゞェクトが単䞀のリポゞトリを共有するモノレポ構造で䜜業する際に、より柔軟性ず効率性を埗られたす。 管理の簡玠化: 単䞀のリポゞトリの Webhook を利甚しお耇数の Amplify アプリを管理でき、耇雑さず朜圚的な障害ポむントを枛らすこずができたす。 ワヌクフロヌ統合の改善: 開発プロセスの他の重芁なワヌクフロヌに Webhook スロットを解攟できたす。 統合された Webhook の抂芁 新しいアプリの堎合 Amplify Hosting でりェブアプリをデプロむ したす。Webhook 機胜が組み蟌たれるので、リポゞトリに自動的に実装されたす。 既存の Amplify ナヌザヌ向け この新機胜を利甚するには、リポゞトリを Amplify アプリに再接続する必芁がありたす。手順は次のずおりです。 AWS 管理コン゜ヌルで Amplify アプリに移動したす。 アプリのリポゞトリ蚭定を探したす。 リポゞトリ情報の暪にある「再接続」ボタンをクリックしたす。 既存の Webhook を新しい統合された Webhook に眮き換えるアクションを確認したす。 手順 2 ぀の Amplify アプリ を含むリポゞトリから、新しい統合された Webhook に切り替える䟋を瀺したす。 各 Webhook は次のようになりたす。 次に Amplify Console に移動し、 App settings → Branch の Reconnect Repository ボタンを芋぀けおください。 Configure GitHub App ず Complete installation をクリックしおください。 しばらくするず、リポゞトリが統合された Webhook に切り替わったこずがわかりたす。 これで準備は敎いたした。このリポゞトリに接続された新しい Amplify アプリは、ここで同じ統合された Webhook を䜿甚したす。 重芁な考慮事項 マむグレヌション䞭の Webhook の制限: すでに Git プロバむダヌが蚱可されおいる Webhook の最倧数に達しおいる堎合、自動マむグレヌションが機胜しない可胜性がありたす。この堎合、事前に既存の Webhook 1 ぀以䞊を手動で削陀する必芁な堎合がありたす。 リヌゞョン別の操䜜: Webhook の移行を含むすべおの操䜜は、リヌゞョン別に行われたす。぀たり、移行は Amplify アプリを再接続したリヌゞョンの Webhook に察しおのみ行われたす。 たずめ AWS Amplify Hosting の統合された Webhook の導入により、リポゞトリ管理が簡玠化され、モノレポなどの耇雑なプロゞェクト構造のサポヌトが匷化されたした。 Webhook のオヌバヌヘッドを削枛し、Git リポゞトリず Amplify アプリの接続をストリヌム化するこずで、開発者はむンフラストラクチャの制限の管理よりも優れたアプリケヌションの構築に集䞭できるようになりたした。 私たちは、この機胜が特に倧芏暡で耇雑なリポゞトリを扱う際の開発ワヌクフロヌを改善するこずを心埅ちにしおいたす。 Amplify コン゜ヌル で Next.js、Nuxt、React、Angular、Vue、その他のフロント゚ンドアプリをデプロむし、 Discord の圓瀟コミュニティに参加しお、ご意芋やご経隓を共有しおください。 本蚘事は、2025 幎 3 月 10 日に公開された Simplifying Multi-App Management in AWS Amplify Hosting を翻蚳したものです。翻蚳は Solutions Architect の吉村が担圓したした。 著者に぀いお Matt Auerbach, Senior Product Manager, Amplify Hosting Matt Auerbach is a NYC-based Product Manager on the AWS Amplify Team. He educates developers regarding products and offerings, and acts as the primary point of contact for assistance and feedback. Matt is a mild-mannered programmer who enjoys using technology to solve problems and making people’s lives easier. B night, however
well he does pretty much the same thing. You can find Matt on Twitter @mauerbac. He previously worked in Developer Relations at Twitch, Optimizely & Twilio. Linsong Wang, Software Development Engineer, Amplify Hosting Linsong builds features that make it easier for customers to host front-end web applications backed by the reliability and convenience of AWS. In his free time, Linsong enjoys exploring cooking recipes, playing piano, and building life improvement prototype
本蚘事は 2025 幎 4 月 9 日に公開された “ Speaking Your Language: Expanded language support in Amazon Q Developer ” を翻蚳したものです。 ゜フトりェア開発がたすたすグロヌバル化するなかで、倚蚀語に察応したツヌルの必芁性は最優先事項になっおいたす。本日は、 Amazon Q Developer における蚀語サポヌトの拡匵を発衚できるこずを嬉しく思いたす。この投皿では、䞖界䞭の開発者が利甚する匷力なプラットフォヌムである Amazon Q Developer における、蚀語サポヌトの拡匵に぀いおご玹介したす。Amazon Q Developer は、アヌキテクチャの議論、ドキュメントの䜜成、むンタヌフェむスのデザむン、アプリケヌション開発など、さたざたな甚途で掻甚されおいたす。 プログラミングの共通蚀語ずしお英語が䜿われおいるのは倉わりたせんが、珟代の゜フトりェア開発の実態はコヌドにずどたりたせん。䞖界䞭の開発者が Amazon Q Developer を掻甚しお、アヌキテクチャの意思決定を議論したり、ドキュメントを䜜成したり、ナヌザヌむンタヌフェヌスを蚭蚈したり、䞖界䞭のナヌザヌを想定したアプリケヌションを構築したりしおいたす。蚀語サポヌトが拡匵されたこずにより、Amazon Q Developer は、システムアヌキテクチャの蚭蚈、ドキュメントの生成、アプリケヌションのロヌカラむズ戊略の怜蚎など、耇雑な技術的抂念に぀いおも、開発者がもっずも䜿いやすい蚀語で、より自然でスムヌズに察話できるようになりたした。 この蚀語サポヌトの拡匵の効果は、以䞋の画像で瀺されおいたす。私は「コンテナホスティングに関する質問」を英語・䞭囜語・ヒンディヌ語・スペむン語で尋ねたした。Amazon Q Developer は、それぞれの蚀語で正確か぀完党な回答を返すだけでなく、技術的な正確さを保ち぀぀、蚀語ごずのニュアンスにも察応しおいたす。さらに、Amazon Q Developer はナヌザヌが䜿甚しおいる蚀語に応じお、関連するフォロヌアップ質問を提案しおくれるため、より盎感的で自然な䌚話䜓隓が可胜になりたす。このように、どの蚀語でも自然にやり取りできるこずは、開発者の集䞭力を劚げず、蚀語の壁による粟神的負荷を取り陀く効果がありたす。 今回の蚀語サポヌト拡匵は、 統合開発環境 (IDE) および コマンドラむンむンタヌフェヌス (CLI) ですでに利甚可胜で、 AWS マネゞメントコン゜ヌル にも近日察応予定です。私の IDE では、 チャット 、 むンラむンチャット 、 むンラむン提案 、 ゚ヌゞェント などに察しお、倚蚀語をサポヌトしたした。以䞋の䟋では、私はフランス語で Amazon Q Developer に「コヌドに TSDoc コメントを远加しおほしい」ずむンラむンチャットで䟝頌したした。 たずえば、韓囜・゜りルで韓囜語のドキュメントを曞く開発者、スペむン・マドリヌドでスペむン語でアヌキテクチャ蚭蚈を怜蚎するスタヌトアップ、ポルトガル語でコラボレヌションするブラゞルのチヌムずいったどなたに察しおも、Amazon Q Developer は、あなたの開発の旅路ず、あなたのお奜きな蚀語をサポヌトできる準備が敎いたした。この蚀語サポヌトの拡匵は、Free Tier ず Pro Tier の䞡方のナヌザヌに本日より提䟛開始されたす。ぜひ Amazon Q Developer の利甚を開始し 、フィヌドバックをお寄せください。私たちは皆さんず共に、゜フトりェア開発の未来をより包括的でアクセスしやすいものにしおいきたす。 翻蚳はApp Dev Consultantの宇賀神が担圓したした。
はじめに AWS は、2024幎12月13日に倧阪リヌゞョンに属する初のAWS Direct Connect ロケヌションであるTelehouse OSAKA2(以埌、OSAKA2)の開蚭を 発衚 したした。これにより、 AWS Direct Connect を利甚しお関西地域に閉じたロケヌション冗長を行うこずが可胜になり、AWS クラりドの倧阪リヌゞョンをメむンリヌゞョンずしたワヌクロヌドおよびハむブリッドネットワヌクをより最適化するこずができたす。もちろん、東京や海倖など他のリヌゞョンぞの接続にも利甚できたす。 関西地域のDirect Connect ロケヌションは、Equinix OS1(以䞋、OS1)に続いお二぀目ずなりたす。しかし、ご存じでしょうか。 OS1 は叀くからあるため、東京リヌゞョンに属しおいたす 。本蚘事では、この二぀のDirect Connect ロケヌションを掻甚したオンプレミスネットワヌクずAWS クラりドずの接続に関するアヌキテクチャず、その考慮点に぀いお解説したす。他のリヌゞョンやDirect Connect ロケヌションをお䜿いになる方も、参考ずなるよう蚘述しおいたす。 なお、この蚘事はDirect Connect ずeBGP の基瀎知識を有した方を察象ずしおいたす。 ロケヌション冗長に぀いお Direct Connect では、お客様ネットワヌクずの接続点をDirect Connect ロケヌションず呌称しおいたす。これは、デヌタセンタヌ内で光ファむバヌによる盎接接続を行う物理的な堎所を瀺しおいたす。 こちらのペヌゞ を参照するず、そのリストを確認するこずができたす。 ネットワヌクの物理レむダヌを怜蚎する際、Direct Connect ロケヌションの遞定は重芁です。WAN サヌビスなどのお客様ネットワヌクずAWS クラりドを接続する堎合、地理的に近いほど高いパフォヌマンスを期埅できるためです。関西地域にデヌタセンタヌや本瀟機胜を持぀お客様や、倧阪リヌゞョンを䞻に利甚しおいるお客様は、OSAKA2 の開蚭により、OS1ず組み合わせおロケヌション冗長を構成するこずが可胜になりたした。 Direct Connect では、お客様のルヌタヌず、AWS のルヌタヌずの間でeBGP を構成したす。お客様のルヌタヌは、ご利甚の回線サヌビスにより、Direct Connect ロケヌションず同䞀のデヌタセンタヌに蚭眮するこずも、離れた別のデヌタセンタヌやオフィスなどに蚭眮するこずもできたす。この構成に関わる技術芁件は、AWS ルヌタヌずお客様ルヌタヌをレむダヌ2で接続し、eBGPピアを構成するためのPoint to Point の通信を行えるこずになりたすeBGP マルチホップを利甚するこずはできたせん。 図1では、OS1 ずOSAKA2 の二぀のDirect Connect ロケヌションず、4぀のDirect Connect 接続を組み合わせお、デヌタセンタヌレベルの障害にも察応できる可甚性を実珟する際の構成䟋を瀺しおいたす。Direct Connect では、 回埩性に関する掚奚事項 や サヌビスレベルアグリヌメント(SLA) にも瀺しおいるずおり、重芁なワヌクロヌドに察しおは耇数のロケヌションを掻甚するこずを掚奚しおいたす。 図1. 最倧回埩性を満たすアヌキテクチャヌ䟋 シナリオ1 アクティブ /スタンバむ構成 耇数のDirect Connect を掻甚しお可甚性を高めるには、きめ现かいトラフィックコントロヌルが必芁になりたす。ここでは、理解しやすいよう4぀のDirect Connect 接続にそれぞれ優先床を蚭定し、アクティブの接続が切断された堎合、優先床順にフェむルオヌバヌを行うこずを芁件ずしたす。぀たり、4重の冗長をずる構成ずなりたす。図2は、その蚭蚈を瀺しおいたす。なお、経路ごずに優先順䜍を制埡するこずも可胜です。 図2.アクティブ/スタンバむ構成の各接続の優先床蚭蚈 シナリオ1-1 AWSからお客様ネットワヌクに向かうトラフィックのコントロヌル AWS のBGP ルヌタヌがお客様のBGPルヌタヌから受信した経路情報は、図2の構成の堎合Direct Connect Gateway やAWS Transit Gateway に䌝搬されたす。4぀の回線のうちどの回線がベストパスずしお採甚されるかに぀いおは、受信した経路情報のBGP アトリビュヌトに䟝存したす。なお、Direct Connect では、AWS ルヌタヌのBGP アトリビュヌト倀を明瀺的に蚭定をするこずはできないこずに泚意しおください。したがっお、図2のような優先床になるようにBGP アトリビュヌトの蚭定をお客様ルヌタヌで行う圢になりたす。 では、具䜓的にどのようにアトリビュヌトを蚭定するべきでしょうか。ここで、BGP のベストパス遞択アルゎリズムを振り返りたす。このような構成の堎合に考慮すべきは、ロヌカルプリファレンス、AS_PATH、Multi-Exit Discriminator (MED)の3぀で、蚘茉順で優先順䜍が高くなりたす。MED に぀いおは優先床が䜎いこずから、 ドキュメント に蚘茉の通り、積極的な掻甚は掚奚しおいたせん。 最もシンプルな方法は、お客様偎のBGP ルヌタヌで、AWS ぞ広告する経路にAS_PATH Prepend を䜿っお優先床を操䜜するこずです。AWS偎で暗黙に蚭定しおいるロヌカルプリファレンス倀が同倀であるず仮定し、図3に瀺すようにAS_PATH 長によっおベストパスを決定させる狙いです。このアプロヌチは、これたで倚くのケヌスで採甚されおきたした。 図3 AS_PATHによる優先床蚭蚈のアプロヌチ ただし、泚意しおください。今回の構成䟋の堎合、これだけではベストパス遞択は期埅通りに行われたせん。これは、 OS1が東京リヌゞョンに属し、OSAKA2が倧阪リヌゞョンに属するこずに起因したす 。 Direct Connect では、AWS からお客様ネットワヌクぞのパスを最適化するため、ロヌカルプリファレンス 倀が暗黙的に蚭定されたす。これは、通信の発信元リヌゞョンず、宛先のDirect Connect ロケヌションがどのリヌゞョンに属するかによっお決定されたす。䟋ずしお、倧阪リヌゞョンから発信された通信は、倧阪リヌゞョンに属するOSAKA2を優先するようにロヌカルプリファレンス 倀が蚭定されたす。ロヌカルプリファレンス 倀はAS_PATH 属性の前に評䟡されるため、OSAKA2がベストパスに採甚されたす。 では、OS1を優先したい堎合どうするべきでしょうか。Direct Connect ではこのようなケヌスのため、暗黙的に蚭定されるロヌカルプリファレンス 倀をお客様の意図通りに䞊曞きするためのBGP Community タグ機胜を提䟛しおいたす。 お客様ルヌタヌから受信した経路に、BGP Community アトリビュヌトの指定されたタグが蚭定されおいるず、AWS は以䞋のような優先順になるようロヌカルプリファレンスの倀を䞊曞きしたす。詳しくは、 ドキュメント をご参照ください。 7224:7100 : 優先蚭定: 䜎 7224:7200 : 優先蚭定: äž­ 7224:7300 : 優先蚭定: 高 䞊蚘の通り、3段階で蚭定するこずができたす。今回の䟋では4回線あるため、3段階では䞍足です。しかしながら、AS_PATH Prepend を組み合わせるこずで、意図した制埡を行うこずができたす。今回は、BGP Community タグを甚いおロヌカルプリファレンス倀を党お等コストになるよう䞊曞きし、AS_PATH による評䟡で優先床1の接続をベストパスずしお遞択させるようにしたす。 図4は、その蚭定を図瀺しおいたす。 図4. Community タグずAS PATH Prepend によるトラフィックコントロヌル このように、Community タグず AS PATH Prepend によっおAWS からお客様ネットワヌクぞのベストパスをコントロヌルできたす。優先床1のBGPピアが切断された堎合、優先床2にフェヌルオヌバヌしたす。優先2が切断されたら優先床3に・・ずいう圢で、順にフェヌルオヌバヌさせるこずができたす。 シナリオ1-2 お客様ネットワヌクからAWS に向かうトラフィックのコントロヌル 続いお、お客様ネットワヌクからAWS に向かうトラフィックのコントロヌルに぀いおです。優先床の芁件は、前述の逆向きの通信ず同様ずしたす。 Direct Connect では、お客様のBGP ルヌタヌに察しお広告する経路のBGP アトリビュヌトをカスタマむズするこずはできたせん。たた、特別な蚭定があらかじめ行われおいるこずもありたせん※1。したがっお、AWS からの経路を受信するお客様のネットワヌクで自由にトラフィックコントロヌルを行うこずができたす。 どのように優先床を蚭定するかに぀いおは、お客様ネットワヌクの構成によっおさたざたな方法が考えられたす。䟋えば、お客様ネットワヌクはOSPF で構成され、Direct Connect のBGP 経路はOSPF ネットワヌクに再配垃するようなケヌスも考えられたす。お客様ネットワヌクが通信事業者のWAN サヌビス等である堎合は、そのサヌビス仕様にも䟝存したす。今回は、図に存圚するCustomer WAN が、BGP アトリビュヌトによる制埡に察応しおいるWAN サヌビスであるず仮定し、AS_PATHにより制埡する䟋をご玹介したす。 図5では、AWSから受け取った経路をWANサヌビスに䌝搬する様子を衚珟しおいたす。 図5. お客様ネットワヌクからAWS 向けトラフィックのコントロヌル䟋 䌝搬する際、AS_PATH により優先順䜍を蚭定しおいたす。先ほどは、お客様ルヌタヌがAWS に広告する経路に察しお蚭定したしたが、今回はAWS から広告されおきた経路をWANサヌビスに䌝搬する際にAS_PATH Prepend を蚭定しおいたす。図5に瀺した衚は、WAN サヌビスが持぀BGPテヌブルのむメヌゞです。今回は特にロヌカルプリファレンスやMED は掻甚したせんでしたが、構成やご利甚のWAN サヌビスによっおは掻甚するこずもありたす。 ※1 Public VIFに぀いおは、AWS が広告する経路にリヌゞョン制埡のためのCommunity タグがサポヌトされおいたす。詳しくは ドキュメント をご参照ください。 シナリオ2 ロヌドバランスECMP構成 Direct Connect は、Equal Cost Multi Path(ECMP) に察応しおいたす。AWS がベストパス遞択を行う際、最も優先床の高いパスが耇数あった堎合、それらはロヌドバランスされたす。本シナリオは、すべおのDirect Connect 接続を等コストに蚭定し、トラフィックをロヌドバランスするこずによっお、突発的なトラフィック増に備えるこずを想定したす。 Direct Connect 接続がすべお1Gbps だったずしたしょう。その堎合、シナリオ1では最倧垯域幅は1Gbps になりたす。 4重の冗長構成が取られおいるため、障害に察しお非垞に堅牢な反面、スタンバむ偎の回線は普段利甚しないこずになりたす。ECMP を利甚するず、すべおの回線を有効掻甚しお最倧4Gbps たで察応するこずができたす。ただし、このような構成で普段から4Gbps のトラフィックを利甚するこずは掚奚したせん。それは、以䞋のような理由によるものです。 ・ECMP によるロヌドバランスは各接続の最倧垯域を考慮しない ・ECMP によるロヌドバランスはネットワヌク機噚に実装により、ある皋床の偏りが生じるこずが想定される ・障害やメンテナンス時に最倧垯域が枛少し、重芁なトラフィックが欠損する可胜性がある 本構成を採甚する堎合、「突発的に1Gbps 以䞊のトラフィックが発生した堎合」に察応できるこず、を芁件ずするこずを掚奚したす。たた、通信経路が行きず垰りで非察称になる可胜性があるため、そのようなトラフィックをフィルタリングする機噚が導入されおいないかどうかも考慮する必芁がありたす。 なお、有効垯域の増加を考える堎合、Direct Connect はLink Aggregation Group (LAG) にも察応しおいたす。 詳しくは ドキュメント をご参照ください。 さお、以䞋に瀺す図6は、ECMP の優先床蚭蚈の考え方を瀺しおいたす。 図6 ECMPを行う際の優先床蚭蚈 党おを同じ優先床1ずしおいたす。なお、䟋ずしおOS1 の二぀の接続を優先床1、OSAKA2の二぀の接続を優先床2ずしお、最倧垯域を 2Gbps ずしおロヌドバランスさせるこずもできたす。芁件により、さたざたな蚭蚈が可胜です。 シナリオ2-1 AWSからお客様ネットワヌク に向かうトラフィックのコントロヌル シナリオ1では、BGPのCommunity タグずAS_PATH 属性を組み合わせお優先床を決定したした。シナリオ2 では、等コストにするこずを目的ずしたすので、以䞋の通り、Commnunity タグのみ利甚したす。 図7 Community タグによる等コスト蚭定 この䟋では、Community タグによっおAWS が暗黙に蚭定するロヌカルプリファレンス倀を䞊曞きし、すべお優先蚭定䞭にするこずによっお等コストに蚭定しおいたす。これにより、AWS からお客様ネットワヌクに向かうすべおのトラフィックは4 ぀の接続にロヌドバランスされたす。シナリオ1で利甚したAS_PATH Prepend を利甚する必芁はありたせん。 シナリオ2-2 お客様ネットワヌクからAWS に向かうトラフィックのコントロヌル 今回はWAN サヌビスを利甚しおいるこずを想定しおいるため、ご利甚のサヌビスがECMP に察応しおいれば、特に優先床を぀けずにWAN サヌビスにAWS からの経路を䌝搬させるこずでECMP を実珟できたす。ご利甚の際は、必ずWAN サヌビスやルヌタヌのサヌビス仕様をご確認ください。 たずめ 本蚘事では、倧阪リヌゞョンに属する初めおのDirect Connect ロケヌションである Telehouse OSAKA2のご玹介ず、これを掻甚した冗長構成ずトラフィックコントロヌルの䟋をご玹介したした。今回ご玹介した内容は、䟋えば東京ずアメリカであったり、異なるリヌゞョンに属するロケヌションが混圚する際にも掻甚できたす。たた、䟋えばEquinix TY2ずOS1など、同じリヌゞョンに属するDirect Connect ロケヌションのみ利甚する際にも、今埌の拡匵に備えおBGP Community タグを利甚するこずを掚奚いたしたす。 本蚘事は、Network Specialist Solutions Architect の奥村が執筆したした。
本蚘事は 2025 幎 4 月 7 日に AWS Machine Learning Blog で公開された Effectively use prompt caching on Amazon Bedrock を翻蚳したものです。翻蚳は゜リュヌションアヌキテクトの川戞枉が担圓したした。 Amazon Bedrock においお、プロンプトキャッシュの䞀般提䟛が開始されたした。Anthropic の Claude 3.5 Haiku ず Claude 3.7 Sonnet に加え、 Nova Micro、 Nova Lite、 Nova Pro モデルで利甚可胜です。耇数の API 呌び出しにおいお頻繁に䜿甚されるプロンプトをキャッシュするこずで、応答時間を最倧 85% 短瞮し、コストを最倧 90% 削枛したす。 プロンプトキャッシュを䜿甚するず、特定の連続したプロンプト郚分 ( プロンプトプレフィックスず呌ばれたす ) をキャッシュ察象ずしお指定できたす。指定されたプロンプトプレフィックスを含むリク゚ストが送信されるず、モデルは入力を凊理し、そのプレフィックスに関連する内郚状態をキャッシュしたす。その埌、同じプロンプトプレフィックスを含むリク゚ストがあるず、モデルはキャッシュから読み取り、入力トヌクンの凊理に必芁な蚈算ステップをスキップしたす。これにより、最初のトヌクンが生成されるたでの時間 (time to first token, TTFT) が短瞮され、ハヌドりェアがより効率的に利甚されたす。そのため、ナヌザヌはより安い䟡栌でサヌビスを利甚できたす。 この蚘事では、Amazon Bedrock のプロンプトキャッシュに関する総合的な説明ず、レむテンシヌ改善ずコスト削枛を実珟するための効果的な掻甚方法を解説したす。 プロンプトキャッシュの仕組み 倧芏暡蚀語モデル (large language model, LLM) の凊理は、䞻に 2 ぀の段階で構成されおいたす。入力トヌクン凊理ず出力トヌクン生成です。 Amazon Bedrock のプロンプトキャッシュは、この入力トヌクン凊理の段階を最適化したす。 たず、プロンプトの関連郚分にキャッシュチェックポむントを指定したす。チェックポむントより前のプロンプト党䜓がキャッシュされるプロンプトプレフィックスになりたす。キャッシュチェックポむントで指定されたものず同じプロンプトプレフィックスを含むリク゚ストを送信するず、LLM はそのプレフィックスがキャッシュに既に保存されおいるかどうかを確認したす。䞀臎するプレフィックスが芋぀かった堎合、LLM はキャッシュから読み取り、最埌にキャッシュされたプレフィックスから入力凊理を再開できたす。これにより、プロンプトプレフィックスを再蚈算するために必芁だった時間ずコストを節玄できたす。 なお、モデルによっおプロンプトキャッシュの察応状況が異なりたすので、泚意ください。察応しおいるモデル、サポヌトされおいるモデル、キャッシュチェックポむントあたりの最小トヌクン数ずリク゚ストあたりの最倧キャッシュチェックポむント数の詳现に぀いおは、 関連ドキュメント を確認しおください。 キャッシュヒットは、プレフィックスが完党に䞀臎した堎合にのみ発生したす。プロンプトキャッシュのメリットを最倧限に掻甚するには、指瀺や䟋などの静的コンテンツをプロンプトの先頭に配眮するこずをお勧めしたす。ナヌザヌ固有の情報などの動的コンテンツは、プロンプトの末尟に配眮しおください。この原則は画像やツヌルにも適甚され、キャッシングを有効にするためにはリク゚スト間で同䞀である必芁がありたす。 次の図は、キャッシュヒットの仕組みを説明しおいたす。 A、B、C、D はプロンプトの異なる郚分を衚しおいたす。 A、B、C がプロンプトプレフィックスずしお指定されおいたす。埌続のリク゚ストに同じ A、B、C のプロンプトプレフィックスが含たれおいる堎合、キャッシュヒットが発生したす。 プロンプトキャッシュを䜿うべき堎面 Amazon Bedrock のプロンプトキャッシュは、耇数の API 呌び出しで頻繁に再利甚される長いコンテキストプロンプトを扱うワヌクロヌドに適しおいたす。この機胜を䜿うず、レスポンスのレむテンシヌを最倧 85% 短瞮し、掚論コストを最倧 90% 削枛できるため、繰り返し䜿甚される長い入力コンテキストを持぀アプリケヌションに特に適しおいたす。プロンプトキャッシュがナヌスケヌスに有益かどうかを刀断するには、キャッシュするトヌクン数、再利甚の頻床、リク゚スト間の時間を芋積もる必芁がありたす。 プロンプトキャッシュに適したナヌスケヌスを以䞋に瀺したす ドキュメントを䜿ったチャット – 最初のリク゚ストでドキュメントを入力コンテキストずしおキャッシュするこずで、各ナヌザヌク゚リの凊理が効率化されたす。これにより、ベクトルデヌタベヌスのような耇雑な゜リュヌションを䜿わなくおも、よりシンプルなアヌキテクチャが実珟できたす。 コヌディングアシスタント – プロンプトで長いコヌドファむルを再利甚するこずで、ほがリアルタむムのむンラむンコヌド提案が可胜になりたす。これにより、コヌドファむルを䜕床も再凊理する時間を倧幅に削枛できたす。 ゚ヌゞェントワヌクフロヌ – より長いシステムプロンプトを䜿甚しお゚ヌゞェントの動䜜を掗緎させおも、゚ンドナヌザヌの䜓隓を損なうこずがありたせん。システムプロンプトや耇雑なツヌル定矩をキャッシュするこずで、゚ヌゞェントフロヌの各ステップの凊理時間を短瞮できたす。 Few-shot å­Šç¿’ – カスタマヌサヌビスや技術的なトラブルシュヌティングなど、倚数の高品質な䟋ず耇雑な指瀺を含める堎合、プロンプトキャッシュが圹立ちたす。 プロンプトキャッシュの䜿甚方法 プロンプトキャッシュを䜿甚する際は、プロンプトの構成芁玠を「繰り返し䜿甚される静的な郚分」ず「動的な郚分」の 2 ぀のグルヌプに分類するこずが重芁です。プロンプトテンプレヌトは、次の図に瀺す構造に埓う必芁がありたす。 1 ぀のリク゚スト内に耇数のキャッシュチェックポむントを䜜成できたす。ただし、モデルごずに制限がありたす。次の図に瀺すように、静的な郚分、キャッシュチェックポむント、動的な郚分ずいう同じ構造に埓う必芁がありたす。 ナヌスケヌス䟋 プロンプトにドキュメントを含める「ドキュメントを䜿ったチャット」のナヌスケヌスは、プロンプトキャッシュに非垞に適しおいたす。この䟋では、プロンプトの静的な郚分はレスポンスフォヌマットに関する指瀺ずドキュメント本文で構成されおいたす。動的な郚分はナヌザヌのク゚リであり、これはリク゚ストごずに倉わりたす。 このシナリオでは、プロンプトの静的な郚分をプロンプトプレフィックスずしお指定し、プロンプトキャッシュを有効にしたす。以䞋のコヌドスニペットは、 Invoke Model API を䜿甚しおこのアプロヌチを実装する方法を瀺しおいたす。次の図に瀺すように、リク゚スト内に 2 ぀のキャッシュチェックポむントを䜜成しおいたす。1 ぀は指瀺甚、もう 1 ぀はドキュメント本文甚です。 以䞋のプロンプトを䜿甚したす def chat_with_document(document, user_query): instructions = ( "I will provide you with a document, followed by a question about its content. " "Your task is to analyze the document, extract relevant information, and provide " "a comprehensive answer to the question. Please follow these detailed instructions:" "\n\n1. Identifying Relevant Quotes:" "\n - Carefully read through the entire document." "\n - Identify sections of the text that are directly relevant to answering the question." "\n - Select quotes that provide key information, context, or support for the answer." "\n - Quotes should be concise and to the point, typically no more than 2-3 sentences each." "\n - Choose a diverse range of quotes if multiple aspects of the question need to be addressed." "\n - Aim to select between 2 to 5 quotes, depending on the complexity of the question." "\n\n2. Presenting the Quotes:" "\n - List the selected quotes under the heading 'Relevant quotes:'" "\n - Number each quote sequentially, starting from [1]." "\n - Present each quote exactly as it appears in the original text, enclosed in quotation marks." "\n - If no relevant quotes can be found, write 'No relevant quotes' instead." "\n - Example format:" "\n Relevant quotes:" "\n [1] \"This is the first relevant quote from the document.\"" "\n [2] \"This is the second relevant quote from the document.\"" "\n\n3. Formulating the Answer:" "\n - Begin your answer with the heading 'Answer:' on a new line after the quotes." "\n - Provide a clear, concise, and accurate answer to the question based on the information in the document." "\n - Ensure your answer is comprehensive and addresses all aspects of the question." "\n - Use information from the quotes to support your answer, but do not repeat them verbatim." "\n - Maintain a logical flow and structure in your response." "\n - Use clear and simple language, avoiding jargon unless it's necessary and explained." "\n\n4. Referencing Quotes in the Answer:" "\n - Do not explicitly mention or introduce quotes in your answer (e.g., avoid phrases like 'According to quote [1]')." "\n - Instead, add the bracketed number of the relevant quote at the end of each sentence or point that uses information from that quote." "\n - If a sentence or point is supported by multiple quotes, include all relevant quote numbers." "\n - Example: 'The company's revenue grew by 15% last year. [1] This growth was primarily driven by increased sales in the Asian market. [2][3]'" "\n\n5. Handling Uncertainty or Lack of Information:" "\n - If the document does not contain enough information to fully answer the question, clearly state this in your answer." "\n - Provide any partial information that is available, and explain what additional information would be needed to give a complete answer." "\n - If there are multiple possible interpretations of the question or the document's content, explain this and provide answers for each interpretation if possible." "\n\n6. Maintaining Objectivity:" "\n - Stick to the facts presented in the document. Do not include personal opinions or external information not found in the text." "\n - If the document presents biased or controversial information, note this objectively in your answer without endorsing or refuting the claims." "\n\n7. Formatting and Style:" "\n - Use clear paragraph breaks to separate different points or aspects of your answer." "\n - Employ bullet points or numbered lists if it helps to organize information more clearly." "\n - Ensure proper grammar, punctuation, and spelling throughout your response." "\n - Maintain a professional and neutral tone throughout your answer." "\n\n8. Length and Depth:" "\n - Provide an answer that is sufficiently detailed to address the question comprehensively." "\n - However, avoid unnecessary verbosity. Aim for clarity and conciseness." "\n - The length of your answer should be proportional to the complexity of the question and the amount of relevant information in the document." "\n\n9. Dealing with Complex or Multi-part Questions:" "\n - For questions with multiple parts, address each part separately and clearly." "\n - Use subheadings or numbered points to break down your answer if necessary." "\n - Ensure that you've addressed all aspects of the question in your response." "\n\n10. Concluding the Answer:" "\n - If appropriate, provide a brief conclusion that summarizes the key points of your answer." "\n - If the question asks for recommendations or future implications, include these based strictly on the information provided in the document." "\n\nRemember, your goal is to provide a clear, accurate, and well-supported answer based solely on the content of the given document. " "Adhere to these instructions carefully to ensure a high-quality response that effectively addresses the user's query." ) document_content = f"Here is the document: <document> {document} </document>" messages_API_body = { "anthropic_version": "bedrock-2023-05-31", "max_tokens": 4096, "messages": [ { "role": "user", "content": [ { "type": "text", "text": instructions, "cache_control": { "type": "ephemeral" } }, { "type": "text", "text": document_content, "cache_control": { "type": "ephemeral" } }, { "type": "text", "text": user_query }, ] } ] } response = bedrock_runtime.invoke_model( body=json.dumps(messages_API_body), modelId="us.anthropic.claude-3-7-sonnet-20250219-v1:0", accept="application/json", contentType="application/json" ) response_body = json.loads(response.get("body").read()) print(json.dumps(response_body, indent=2)) response = requests.get("https://aws.amazon.com/blogs/aws/reduce-costs-and-latency-with-amazon-bedrock-intelligent-prompt-routing-and-prompt-caching-preview/") blog = response.text chat_with_document(blog, "What is the blog writing about?") 䞊蚘のコヌドスニペットに察するレスポンスには、キャッシュの読み取りず曞き蟌みに関するメトリクスを瀺す usage セクションがありたす。以䞋は、最初のモデル呌び出しからのレスポンスの䟋です { "id": "msg_bdrk_01BwzJX6DBVVjUDeRqo3Z6GL", "type": "message", "role": "assistant", "model": "claude-3-7-sonnet-20250219”, "content": [ { "type": "text", "text": "Relevant quotes:\n[1] \"Today, Amazon Bedrock has introduced in preview two capabilities that help reduce costs and latency for generative AI applications\"\n\n[2] \"Amazon Bedrock Intelligent Prompt Routing \u2013 When invoking a model, you can now use a combination of foundation models (FMs) from the same model family to help optimize for quality and cost... Intelligent Prompt Routing can reduce costs by up to 30 percent without compromising on accuracy.\"\n\n[3] \"Amazon Bedrock now supports prompt caching \u2013 You can now cache frequently used context in prompts across multiple model invocations... Prompt caching in Amazon Bedrock can reduce costs by up to 90% and latency by up to 85% for supported models.\"\n\nAnswer:\nThe article announces two new preview features for Amazon Bedrock that aim to improve cost efficiency and reduce latency in generative AI applications [1]:\n\n1. Intelligent Prompt Routing: This feature automatically routes requests between different models within the same model family based on the complexity of the prompt, choosing more cost-effective models for simpler queries while maintaining quality. This can reduce costs by up to 30% [2].\n\n2. Prompt Caching: This capability allows frequent reuse of cached context across multiple model invocations, which is particularly useful for applications that repeatedly use the same context (like document Q&A systems). This feature can reduce costs by up to 90% and improve latency by up to 85% [3].\n\nThese features are designed to help developers build more efficient and cost-effective generative AI applications while maintaining performance and quality standards." } ], "stop_reason": "end_turn", "stop_sequence": null, "usage": { "input_tokens": 9, "cache_creation_input_tokens": 37209, "cache_read_input_tokens": 0, "output_tokens": 357 } } cache_creation_input_tokens の倀が 37,209 であるこずから、キャッシュチェックポむントが正垞に䜜成され、 37,209 トヌクンがキャッシュされたこずがわかりたす。この状態を次の図に瀺したす。 次回のリク゚ストでは、別の質問をするこずができたす chat_with_document(blog, "what are the use cases?") プロンプトの動的な郚分は倉曎されたしたが、静的な郚分ずプロンプトプレフィックスは同じたたです。このため、続くモデル呌び出しではキャッシュが掻甚されるこずが期埅できたす。以䞋のコヌドをご芧ください { "id": "msg_bdrk_01HKoDMs4Bmm9mhzCdKoQ8bQ", "type": "message", "role": "assistant", "model": "claude-3-7-sonnet-20250219", "content": [ { "type": "text", "text": "Relevant quotes:\n[1] \"This is particularly useful for applications such as customer service assistants, where uncomplicated queries can be handled by smaller, faster, and more cost-effective models, and complex queries are routed to more capable models.\"\n\n[2] \"This is especially valuable for applications that repeatedly use the same context, such as document Q&A systems where users ask multiple questions about the same document or coding assistants that need to maintain context about code files.\"\n\n[3] \"During the preview, you can use the default prompt routers for Anthropic's Claude and Meta Llama model families.\"\n\nAnswer:\nThe document describes two main features with different use cases:\n\n1. Intelligent Prompt Routing:\n- Customer service applications where query complexity varies\n- Applications needing to balance between cost and performance\n- Systems that can benefit from using different models from the same family (Claude or Llama) based on query complexity [1][3]\n\n2. Prompt Caching:\n- Document Q&A systems where users ask multiple questions about the same document\n- Coding assistants that need to maintain context about code files\n- Applications that frequently reuse the same context in prompts [2]\n\nBoth features are designed to optimize costs and reduce latency while maintaining response quality. Prompt routing can reduce costs by up to 30% without compromising accuracy, while prompt caching can reduce costs by up to 90% and latency by up to 85% for supported models." } ], "stop_reason": "end_turn", "stop_sequence": null, "usage": { "input_tokens": 10, "cache_creation_input_tokens": 0, "cache_read_input_tokens": 37209, "output_tokens": 324 } } 37,209 トヌクンはキャッシュから読み蟌たれたドキュメントず指瀺内容に察応し、ナヌザヌク゚リ郚分は 10 トヌクンずなっおいたす。この状態を次の図に瀺したす。 別のブログ蚘事にドキュメントを倉曎しおみたしょう。ただし、指瀺内容は同じたたにしたす。今回のリク゚ストの構造は指瀺郚分がドキュメント本文よりも前に配眮されおいるため、指瀺郚分のプロンプトプレフィックスに぀いおはキャッシュヒットが期埅できたす。以䞋のコヌドをご芧ください response = requests.get(https://aws.amazon.com/blogs/machine-learning/enhance-conversational-ai-with-advanced-routing-techniques-with-amazon-bedrock/) blog = response.text chat_with_document(blog, "What is the blog writing about?") { "id": "msg_bdrk_011S8zqMXzoGHABHnXX9qSjq", "type": "message", "role": "assistant", "model": "claude-3-7-sonnet-20250219", "content": [ { "type": "text", "text": "Let me analyze this document and provide a comprehensive answer about its main topic and purpose.\n\nRelevant quotes:\n[1] \"When you're designing a security strategy for your organization, firewalls provide the first line of defense against threats. Amazon Web Services (AWS) offers AWS Network Firewall, a stateful, managed network firewall that includes intrusion detection and prevention (IDP) for your Amazon Virtual Private Cloud (VPC).\"\n\n[2] \"This blog post walks you through logging configuration best practices, discusses three common architectural patterns for Network Firewall logging, and provides guidelines for optimizing the cost of your logging solution.\"\n\n[3] \"Determining the optimal logging approach for your organization should be approached on a case-by-case basis. It involves striking a balance between your security and compliance requirements and the costs associated with implementing solutions to meet those requirements.\"\n\nAnswer:\nThis document is a technical blog post that focuses on cost considerations and logging options for AWS Network Firewall. The article aims to help organizations make informed decisions about implementing and managing their firewall logging solutions on AWS. Specifically, it:\n\n1. Explains different logging configuration practices for AWS Network Firewall [1]\n2. Discusses three main architectural patterns for handling firewall logs:\n - Amazon S3-based solution\n - Amazon CloudWatch-based solution\n - Amazon Kinesis Data Firehose with OpenSearch solution\n3. Provides detailed cost analysis and comparisons of different logging approaches [3]\n4. Offers guidance on balancing security requirements with cost considerations\n\nThe primary purpose is to help AWS users understand and optimize their firewall logging strategies while managing associated costs effectively. The article serves as a practical guide for organizations looking to implement or improve their network security logging while maintaining cost efficiency [2]." } ], "stop_reason": "end_turn", "stop_sequence": null, "usage": { "input_tokens": 9, "cache_creation_input_tokens": 37888, "cache_read_input_tokens": 1038, "output_tokens": 385 } } レスポンスを確認するず、指瀺郚分は 1,038 トヌクンをキャッシュから読み取っおおり、新しいドキュメント本文に぀いおは 37,888 トヌクンをキャッシュに曞き蟌んでいるのがわかりたす。この状態を、次の図に瀺したす。 コスト削枛効果 キャッシュヒットが発生するず、Amazon Bedrock はコンピュヌティングの節玄分をキャッシュされたコンテキストのトヌクンごずの割匕ずしおお客様に還元したす。朜圚的なコスト削枛効果を蚈算するには、たず Amazon Bedrock のレスポンスにあるキャッシュ曞き蟌み / 読み取りメトリクスを䜿甚しお、プロンプトキャッシュの䜿甚パタヌンを把握する必芁がありたす。その埌、1,000 入力トヌクンあたりの䟡栌 (キャッシュ曞き蟌み) ず 1,000 入力トヌクンあたりの䟡栌 (キャッシュ読み取り) を䜿っお朜圚的なコスト削枛効果を蚈算できたす。詳しい䟡栌情報に぀いおは、 Amazon Bedrock の料金 をご芧ください。 レむテンシヌベンチマヌク プロンプトキャッシュは、繰り返し䜿甚されるプロンプトの TTFT パフォヌマンスを向䞊させるために最適化されおいたす。この機胜は、チャットプレむグラりンドのような耇数回のやり取りを䌎う䌚話型アプリケヌションに非垞に適しおいたす。たた、倧きなドキュメントを繰り返し参照する必芁があるナヌスケヌスにも圹立ちたす。 ただし、2,000 トヌクンにも及ぶ長倧なシステムプロンプトの埌に、頻繁に内容が倉わる長いテキストが続くようなワヌクロヌドでは、プロンプトキャッシュの効果があたり発揮されない堎合がありたす。このような状況では、キャッシュによるメリットが限定的になっおしたいたす。 プロンプトキャッシュの䜿甚方法ずベンチマヌク方法に぀いおは、 GitHub リポゞトリ にノヌトブックを公開しおいたす。ベンチマヌク結果は、入力トヌクン数、キャッシュされたトヌクン数、出力トヌクン数など、ナヌスケヌスによっお異なりたす。 Amazon Bedrock クロスリヌゞョン掚論 プロンプトキャッシュは、 クロスリヌゞョン掚論 (CRIS) ず組み合わせお䜿甚できたす。クロスリヌゞョン掚論は、掚論リク゚ストを凊理するために地理的に最適な AWS リヌゞョンを自動的に遞択し、リ゜ヌスずモデルの可甚性を最倧化したす。需芁が高い時期には、これらの最適化によりキャッシュ曞き蟌みが増加する可胜性がありたす。 メトリクスずオブザヌバビリティ プロンプトキャッシュのオブザヌバビリティは、Amazon Bedrock を䜿甚するアプリケヌションのコスト削枛ずレむテンシヌ改善に䞍可欠です。䞻芁なパフォヌマンスメトリクスをモニタリングするこずで、開発者は長いプロンプトの TTFT を最倧 85% 削枛し、コストを最倧 90% カットするずいった倧幅な効率改善を達成できたす。これらのメトリクスは、開発者がキャッシュパフォヌマンスを正確に評䟡し、キャッシュ管理に関する戊略的な決定を行うために重芁です。 Amazon Bedrock でのモニタリング Amazon Bedrock は API レスポンスの usage セクションでキャッシュパフォヌマンスデヌタを提䟛しおいたす。これにより開発者は、キャッシュヒット率、トヌクン消費量読み取りず曞き蟌みの䞡方、レむテンシヌ改善などの重芁なメトリクスを远跡できたす。これらの情報を掻甚するこずで、チヌムはキャッシング戊略を効果的に管理し、アプリケヌションの応答性を高め、運甚コストを削枛できたす。 Amazon CloudWatch でのモニタリング Amazon CloudWatch は AWS サヌビスの健党性ずパフォヌマンスをモニタリングするための匷力なプラットフォヌムです。 Amazon Bedrock モデル専甚の新しい自動ダッシュボヌドも含たれおいたす。これらのダッシュボヌドは䞻芁なメトリクスに玠早くアクセスし、モデルのパフォヌマンスをより深く理解できるようになっおいたす。 カスタムオブザヌバビリティダッシュボヌドを䜜成するには、以䞋の手順を実行したす CloudWatch コン゜ヌルで新しいダッシュボヌドを䜜成したす。詳しい手順に぀いおは、 Improve visibility into Amazon Bedrock usage and performance with Amazon CloudWatch を参照ください。 デヌタ゜ヌスタむプ欄の CloudWatch を遞択し、初期のりィゞェットのタむプずしお 円 を遞択したす ( これは埌で調敎可胜です ) 。 メトリクスの時間範囲 ( 1 時間、 3 時間、 1 日など ) をモニタリングニヌズに合わせお曎新したす AWS 名前空間で Bedrock を遞択したす 怜玢ボックスに「 cache 」ず入力しおキャッシュ関連のメトリクスをフィルタリングしたす モデルに぀いおは、 anthropic.claude-3-7-sonnet-20250219-v1:0 を芋぀け、 CacheWriteInputTokenCount ず CacheReadInputTokenCount の䞡方を遞択したす 「りィゞェットの䜜成」を遞択し、その埌「保存」を遞んでダッシュボヌドを保存したす 以䞋は、このりィゞェットを䜜成するためのサンプル JSON 蚭定です { "view": "pie", "metrics": [ [ "AWS/Bedrock", "CacheReadInputTokenCount" ], [ ".", "CacheWriteInputTokenCount" ] ], "region": "us-west-2", "setPeriodToTimeRange": true } キャッシュヒット率の把握 キャッシュヒット率を分析するには、 CacheReadInputTokens ず CacheWriteInputTokens の䞡方のメトリクスを確認する必芁がありたす。䞀定期間にわたっおこれらのメトリクスを集蚈するこずで、キャッシング戊略の効率に぀いおの掞察を埗るこずができたす。 Amazon Bedrock 料金ペヌゞ に掲茉されおいるモデル固有の 1,000 入力トヌクンあたりの䟡栌キャッシュ曞き蟌みず 1,000 入力トヌクンあたりの䟡栌キャッシュ読み取りを䜿甚すれば、特定のナヌスケヌスの朜圚的なコスト削枛を芋積もるこずができたす。 たずめ この蚘事では、 Amazon Bedrock のプロンプトキャッシュに぀いお、その仕組み、䜿甚べき堎面、効果的な掻甚方法を玹介したした。あなたのナヌスケヌスがこの機胜の恩恵を受けるかどうかを慎重に評䟡するこずが重芁です。プロンプトの構造を工倫するこず、静的コンテンツず動的コンテンツの違いを理解するこず、そしお特定のニヌズに合った適切なキャッシング戊略を遞択するこずが重芁です。CloudWatch メトリクスを䜿甚しおキャッシュパフォヌマンスをモニタリングし、この蚘事で説明した実装パタヌンに埓うこずで、高いパフォヌマンスを維持しながら、より効率的でコスト効果の高い AI アプリケヌションを構築できたす。 Amazon Bedrock のプロンプトキャッシュの䜿い方の詳现に぀いおは、 Prompt caching for faster model inference を参照ください。 著者に぀いお Sharon Li は、マサチュヌセッツ州ボストンを拠点ずする Amazon Web Services (AWS) の AI/ML スペシャリスト゜リュヌションアヌキテクトです。最先端技術の掻甚に情熱を持ち、 AWS クラりドプラットフォヌムで革新的な生成 AI ゜リュヌションの開発ず導入に取り組んでいたす。 Shreyas Subramanian は、プリンシパルデヌタサむ゚ンティストずしお、生成 AI ずディヌプラヌニングを掻甚しお AWS サヌビスを䜿甚したビゞネス課題の解決を支揎しおいたす。倧芏暡最適化ず機械孊習のバックグラりンドを持ち、最適化タスクの加速に機械孊習ず匷化孊習を䜿甚しおいたす。 Satveer Khurpa は、 Amazon Web Services のシニア WW スペシャリスト゜リュヌションアヌキテクトであり、 Amazon Bedrock セキュリティを専門ずしおいたす。クラりドベヌスのアヌキテクチャに関する専門知識を掻かし、さたざたな業界のクラむアント向けに革新的な生成 AI ゜リュヌションを開発しおいたす。生成 AI 技術ずセキュリティ原則ぞの深い理解により、堅牢なセキュリティ䜓制を維持しながら、新たなビゞネス機䌚を開拓し、実質的な䟡倀を掚進するスケヌラブルで安党か぀責任あるアプリケヌションの蚭蚈を行っおいたす。 Kosta Belz は、 AWS Generative AI Innovation Center のシニア応甚科孊者ずしお、お客様が䞻芁なビゞネス課題を解決するための生成 AI ゜リュヌションの蚭蚈ず構築を支揎しおいたす。 Sean Eichenberger は、 AWS のシニアプロダクトマネヌゞャヌです。
2025/3/31 – 4/4に䞖界最倧芏暡の補造業展瀺䌚ハノヌバヌメッセが開催されたした。AWS は「Built for Industrial AI」をテヌマに、ものづくりの党プロセスにおける AI の掻甚を蚎求したした。AWS ブヌスには、AWS のフォヌカス゚リアである「Smart Manufacturing」「Smart Products」「Engineering &amp; Design」「Supply Chain」「Sustainability」の぀の゚リアに 13 の AWS キオスクず、39 のパヌトナヌキオスクの蚈 52 のキオスクが蚭眮されたした。日本からも倚くのお客様に来堎頂き、私たち AWS Japan の補造業担圓スペシャリスト、営業、゜リュヌションアヌキテクトがブヌスツアヌずいう圢で AWS のブヌスをご玹介したした。 このブログでは AWS ブヌスの抂芁ず展瀺゜リュヌションに぀いおご玹介したす。 AWSブヌス党䜓像 写真1AWS ブヌス党景 こちらが AWS ブヌスの党景です。AWS 補造業向けにフォヌカス゚リアである「Smart Manufacturing」「Smart Products」「Engineering &amp; Design」「Supply Chain」「Sustainability」ず生成 AI を掻甚したナヌスケヌスの実装䟋が入口近くに展瀺されおいたした。 昚幎のハノヌバヌメッセでの AWS ブヌス からの倉化点ずしお倧きく぀挙げおおきたす。 ビゞネスに貢献する生成 AI の実装 昚幎たでの生成 AI のコンセプト玹介やシンプルなチャットの展瀺からフェヌズが進み、業務のナヌスケヌスにおける具䜓的な課題および「人手䞍足」「匠の技の䌝承」などの業界課題を解決する手段ずしお生成 AI の掻甚が進み、実装が進んでいたす。AI ゚ヌゞェント圢匏での実装も進み、高床なタスクをこなせるようになっおきおいたす。 すぐに䜿える Vertical SaaS の増加 䞍確実で倉化の早い垂況に察応するためには新しい取り組みの PoC を早期に完了しお業務掻甚に進める必芁がありたす。産業機噚接続、OT Security、デヌタ基盀など補造業に特化した パヌトナヌ䌁業が提䟛する SaaS の増加によりすぐに䟡倀怜蚌や本番導入を進められる状況が敎っおきおいたす。 DataOps の加速 2 の SaaS の増加ずも関連したすが、ずりわけ Smart Factory は机䞊のコンセプトから実甚フェヌズに移り、単に機噚からデヌタを吞い䞊げるだけではなく持続的な運甚に必芁なツヌルが増加したした。具䜓的にはデヌタの加工、統合、デヌタモデリング、゚ッゞ偎での異垞怜知など高床な機胜を持぀゜リュヌション HighByte 、 LITMUS 等が増加しおいたす。䌁業党䜓のデヌタ掻甚Digital Threadの実珟も、生成 AI の登堎により技術的な障壁は䞋がり始めおいたす。 それでは、ここからは各ブヌスの泚目展瀺に぀いおご玹介しおいきたす。 Smart Manufacturing 写真2昚幎に匕き続き展瀺された e-Bike Smart Factory デモ 昚幎のハノヌバヌメッセでは䞭倮に鎮座しおいた e-Bike Smart Factory デモが今幎も展瀺されおいたした。様々なベンダヌの補品を組合せたリアルな工堎ラむンだけでなく゚ンゞニアリングチェヌンからサプラむチェヌンたで䞀気通貫で AWS 䞊で動かすずいうショヌケヌス的なデモになっおいたす。䞀方で今幎は少し端の方に寄せられおおり、その代わりに䞭倮に配眮されおいたのは、地元ドむツの䌁業である SYNAOS によるマルチベンダヌの AMR/AGV コントロヌラヌによるデモです。 写真3SYNAOS によるマルチベンダヌのAMR制埡デモ KUKA ず SHERPA のメヌカヌの異なる AMR を協調制埡しおいたした。既に VW 瀟においお 40 メヌカヌ 160 台を超える AGV / AMR / フォヌクリフトを制埡しおいるず玹介されおいたした。珟圚 45 メヌカヌに察応しおおり、日本のメヌカヌではオムロンに察応しおいるずのこずで、テスト環境では最倧 600 台たで制埡可胜ずのこずです。 写真4AWS Industrial Data Fabric ブヌスず説明員の Scott 氏 DataOps に関連しお数幎前から AWS が提唱しおいる Industrial Data Fabric ( 産業デヌタファブリック ) に関しおも様々なパヌトナヌの参画によっおパヌトナヌ゜リュヌションを組み合わせたデモが行われおいたした。たた、ハノヌバヌメッセ開催期間䞭には日立補䜜所様が 囜内初の IDF パヌトナヌずしお登録 されたした。産業デヌタファブリックに぀いおは今幎の 6 月に開催する AWS Summit Japan 2025 でも展瀺が行われたすのでご期埅䞋さい。 写真5Process Manufacturing on AWS ブヌスず説明員の Mickael 氏ず Miguel 氏 もう䞀぀、プロセス補造業における技術䌝承や人材䞍足ずいった課題に察しお、日々の口頭によるやり取りをノりハりずしお蓄積し AI アシスタントずしお業務に掻甚するデモを行いたした。実はこちらは日本の゜リュヌションアヌキテクトが昚幎の AWS Summit で䜜成しお倧奜評だったデモ をベヌスに倚蚀語化させたものになりたす。 Smart Products 写真6Smart Products &amp; Service on AWS ブヌスず説明員の山本氏ず新柀氏 Smart Products のブヌスでは補品の開発ず運甚の芳点で぀の展瀺を行い、゜フトりェアの遠隔曎新や、Amazon Q Developer, GitLab Duo ずいった生成 AI の掻甚により組み蟌み゜フトりェア開発を加速する日本発のデモず、IoT の機胜を組み蟌んだスマヌトプロダクトから埗られた情報からアフタヌサヌビスをシヌムレスに行うデモを展瀺したした。このデモでは生成 AI ゚ヌゞェントを掻甚し、来堎者の関心も高く、生成 AI の䜿い方が具䜓的でむメヌゞが出来たず奜評でした。 写真7デバむスりォヌル 工堎蚭備だけでなくスマヌトプロダクトを AWS に安党か぀簡単に繋ぐ方法ずしお AWS IoT Greengrass 、 AWS IoT ExpressLink 、 FreeRTOS がありたす。これらに察応した認定デバむスがデバむスりォヌルずしお展瀺されおいたした。開催堎所がペヌロッパずいうこずもあり、日本ではあたり芋かけるこずの少ないメヌカヌも倚くありたした。たたデバむスりォヌルの巊䞊にあるデバむスは既存の通信機胜がない補品に組み蟌んで䜿っお頂くようなデバむスずなっおおり、こんなものたで出しおいるんだず驚きの声が聞かれたした。パヌトナヌデバむスに興味のある方は是非 こちら からご芧ください。 Engineering &amp; Design 写真8Engineering &amp; Design on AWS ブヌスず説明員の Patrice 氏 Engineering &amp; Design のブヌスで泚目を济びおいたのは、生成 AI を掻甚し 2D の写真から 3D のモデルを生成しおシミュレヌションたで行うずいうデモです。 こちら はワヌクショップの圢で公開されおいたす。ご興味がある方は䞀床トラむしおみおは劂䜕でしょうかたたシミュレヌションの分野では今たでむンプット条件に察しお倧量のコンピュヌタヌリ゜ヌスず時間を掛けおアりトプットずなるシミュレヌション結果を生成しおいたものを、サロゲヌトモデルず呌ばれる機械孊習を甚いおシミュレヌション結果を予枬するこずで、埓来のシミュレヌションに比べお時間ずコンピュヌタリ゜ヌスの削枛を行うデモも行っおいたした。倧量のシミュレヌション条件を埮調敎しお頻繁に行うこずが倚いナヌスケヌスにおいおは有効な手段ずなる可胜性がありたす。日本のお客様でも取組みを始めおいらしゃるようですが、ただただ知られおいないこれからの技術だず思いたす。 Supply Chain 写真9AWS Supply Chain のブヌスず説明員の Pawel 氏 Supply Chain のブヌスは昚幎に匕き続き AWS Supply Chain を䞭心に e-Bike Smart Factory ず連携した展瀺を行っおいたした。AWS Supply Chain は、AWS では珍しいビゞネスアプリケヌションずしお提䟛されおおり、既存のシステムの倖付けで圚庫の可芖化や分析及び最適化を行うこずができるサヌビスずなっおいたす。昚幎ずの倧きな違いずしおは、 昚幎末に reInvent で発衚された BMW ずの協業 による Catena-X ぞの察応です。2025 幎䞭の正匏リリヌスに向けお、今回は画面むメヌゞを説明しおいたした。 Build for Industrial AI 写真10毎日盛況だった Build for Industrial AI のコヌナヌ AWS ブヌスの入り口にあった 4 ぀のナヌスケヌスを想定した生成 AI の実装䟋が展瀺されおいたコヌナヌには垞に人だかりが出来おいたした。 昚幎末にリリヌス された AWS IoT SiteWise Assistant による蚭備から取埗されたデヌタの内容を生成 AI が人が理解しやすく自然蚀語でサマリヌしおくれるデモ。生成 AI アシスタントである Amazon Q Business を䜿った補造珟堎のドキュメントを䜿ったデモ。クラりド䞊でファむンチュヌニングされた生成 AI モデルを゚ッゞデバむスで動かし補造珟堎での利甚を想定したアシスタントのデモ。などの展瀺を行いたしたが、このブログでは最もお客様からの反響が倧きかった生成 AI を䜿った倖芳怜査のデモに぀いおご玹介したす。 写真11Amazon Nova を䜿った倖芳怜査のデモ これたでの機械孊習モデルによる倖芳怜査では、良品 / 䞍良品の画像を事前孊習し、その物䜓専甚の機械孊習モデルを䜜成する必芁がありたした。最新の生成 AI のモデルでは、マルチモヌダルず呌ばれるテキストだけでなくむンプットされた画像を理解出来るようになっおきおいるのはご存じの方も倚いず思いたす。マルチモヌダルに察応した Amazon Nova を䜿っお事前孊習無しで、様々な物䜓の倖芳怜査をプロンプト生成 AI ぞの指瀺文章だけで行うずいうデモです。怜出粟床やスピヌドに驚かれおいるお客様が倚かったです。実際の珟堎でさっそく詊しおみたいずいう声も聞かれたした。 たずめ このブログでは 2025 幎のハノヌバヌメッセにおける AWS ブヌスの抂芁ず泚目の展瀺をポむントを絞っおお届けしたした。熱気に満ちた 5 日間のハノヌバヌメッセの雰囲気が少しでも䌝わったでしょうか今回のブログは速報ずいう圢でお届けしたしたので、パヌトナヌブヌス含めお、ただただお䌝えしきれないこずが沢山ありたす。そちらに぀いおは、4 月 24 日にハノヌバヌメッセに関する無料りェビナヌを開催臎したすので、ぜひそちらも合わせおご芧くださいお申蟌みは こちら 。我々日本のスタッフは、日本の補造業の皆さんの発展をサポヌトさせお頂きたす。気になった内容があれば、担圓営業もしくは、 こちら たでお問い合わせ䞋さい。 来幎のハノヌバヌメッセ2026/4/20 – 4/24では、日本の補造業の事䟋などが展瀺できるこずを期埅しおいたす。たた今幎の AWS Summit Japan2025/6/25 – 6/26 でも補造業の皆さんに向けた展瀺や事䟋セッションなどが倚数䌁画されおいたす。こちらも是非早めの ゚ントリヌ をお願いしたす。皆様にお䌚いできるのを楜しみにしおいたす。 このブログは補造業担圓の゜リュヌションアヌキテクト氎野貎博が担圓したした。 著者に぀いお 氎野 貎博 氎野貎博は、補造業のお客様をご支揎しおいる゜リュヌションアヌキテクトです。サプラむチェヌン領域を埗意ずしおおり、奜きな AWS サヌビスは AWS Supply Chain です。趣味は、ドラマや映画の゚キストラに参加するこずです。 <!-- '"` -->
AWS の生成 AI ワヌクロヌドのコスト最適化に関するシリヌズの第 2 回目のブログぞようこそ。 最初のブログ では、生成 AI を適甚するためのさたざたな実装アプロヌチずクラりド財務管理の原則に関する抂芁を説明したした。今回は、Amazon Elastic Compute Cloud ( Amazon EC2 ) ず Amazon SageMaker AI を䜿甚し、カスタム AI モデルの構築ずデプロむに関するコスト最適化戊略に぀いお詳しく説明したす。倧芏暡な蚀語モデルをトレヌニングする堎合、既存のモデルをファむンチュヌニングする堎合や掚論゚ンドポむントをデプロむする堎合いずれにも関連する、Amazon EC2 のむンスタンスタむプの遞定、キャパシティ管理やコミットメントプランニングなどの䞻芁なコスト芁因を説明したす。たた、Amazon SageMaker AI のモデル最適化、トレヌニング効率やデプロむ戊略に぀いおも説明したす。これらのプラクティスは、独自の AI むンフラストラクチャヌの管理に䌎う柔軟性ず制埡を維持しながら、パフォヌマンス芁件ずコスト効率のバランスを取るのに圹立ちたす。 Amazon EC2 ず SageMaker AI は、生成 AI の基盀ずなる AWS サヌビスのうちの 2 ぀です。Amazon EC2 はトレヌニングず掚論に必芁なスケヌラブルなコンピュヌティングを提䟛し、SageMaker AI はモデル開発、デプロむや最適化のための組み蟌みツヌルを提䟛したす。生成 AI ワヌクロヌドには高性胜アクセラレヌタヌ (GPU、 Trainium や Inferentia ) ず膚倧な凊理が必芁であり、効率的なリ゜ヌス管理がないずコストが高くなる可胜性があるため、コスト最適化は非垞に重芁です。以䞋のコスト最適化戊略を掻甚するこずで、パフォヌマンスずスケヌラビリティを維持しながらコストを削枛できたす。 画像 1「Amazon EC2 ず SageMaker AI のコスト最適化戊略:コスト削枛 vs 劎力」このグラフは説明のみを目的ずしおいたす。実際に必芁な劎力ず達成されるコスト削枛は、実装芏暡、むンフラストラクチャヌ、およびチヌムの専門知識に基づいお倉わる堎合がありたす。 Amazon EC2 1. 最適なむンスタンスタむプの遞択 Amazon EC2 むンスタンスは自分でデプロむを管理する䞻芁コンポヌネントであり、適切なむンスタンスタむプを遞択するこずが重芁です。 AWS Graviton 搭茉のような CPU ベヌスのむンスタンスタむプでは、 AWS Compute Optimizer を䜿甚しおむンスタンスを簡単に分析し、適切なサむズを蚭定できたす。生成 AI ゜リュヌションには通垞、NVIDIA GPU たたは Tranium や Inferentia などの AWS AI チップを搭茉した高速むンスタンスが必芁です。AWS Trainium および Inferentia ベヌスのむンスタンスは、トレヌニングず掚論のコストパフォヌマンスが最倧 30 – 50% 向䞊し、ワヌクロヌドにおいお費甚察効果の高いオプションずなりたす。GPU ベヌスのむンスタンスを適切なサむズにするには、 CloudWatch ゚ヌゞェントを䜿甚した NVIDIA GPU の利甚率の有効化 を参照しおください。これにより、AWS Compute Optimizer は NVIDIA GPU の䜿甚率を収集し、適切なサむズの掚奚事項を提瀺できたす。 デヌタセット、ワヌクロヌドやモデルに察するむンスタンスのパフォヌマンスをより包括的に分析するには、コンテキストテストを䜿甚する必芁がありたす。 FM Bench などのツヌルは、さたざたなむンスタンスタむプずサヌビングスタックのパフォヌマンスを分析するこずで、このテストを合理化するのに圹立ちたす。掚論レむテンシヌ、1 分あたりのトランザクション数、゚ラヌ率やトランザクションあたりのコストを瀺すマヌクダりンレポヌトを通じお、最も費甚察効果の高い構成を特定するのに圹立ちたす。レポヌトには、説明文、衚や図が含たれおおり、むンスタンスを適切なサむズに蚭定し、必芁な分だけを支払っおいるこずを確認するのに必芁な情報が蚘茉されおいたす。 2. スマヌトキャパシティ管理 䜿甚するむンスタンスタむプを理解したら、次のステップはキャパシティ管理戊略を理解するこずです。考えるべきよくある質問は次のずおりです。 むンスタンスはいく぀必芁ですか? どれくらいの頻床で実行する必芁がありたすか どれくらいの期間必芁ですか オンデマンドキャパシティ予玄 (ODCR) ODCR では、特定のアベむラビリティヌゟヌン (AZ) にある Amazon EC2 むンスタンスのコンピュヌティングキャパシティを予玄できたす。機械孊習 (ML) モデルのトレヌニングずファむンチュヌニングのために ODCR を䜿甚するこずで、予玄した高速むンスタンス (GPU、Trainium や Inferentia) に䞭断されるこずなくアクセスできたす。キャパシティ芁件が厳しい堎合や、゜リュヌションでキャパシティの確保が必芁な堎合は、ODCR の䜿甚を怜蚎しおください。 ODCR は長期コミットメントを必芁ずせず、い぀でも倉曎たたはキャンセルできたす。キャパシティヌ予玄は、予玄されおいるキャパシティヌでむンスタンスを実行するかどうかにかかわらず、同等のオンデマンド料金が請求されたす。アカりントに ODCR がプロビゞョニングされるずすぐに請求が開始され、キャパシティ予玄がアカりントにプロビゞョニングされおいる間も請求は継続されたす。 ODCR を効率的に䜿甚するには、䜿甚率を監芖するこずが重芁です。これを実珟する方法の 1 ぀は、Amazon CloudWatch を利甚するこずです。CloudWatch では、「AvailableInstanceCount」などのメトリクスを監芖するアラヌムを蚭定できたす。このメトリクスは、ODCR 内の未䜿甚のむンスタンスの数を刀断するのに圹立ちたす。ODCR を監芖するもう 1 ぀の方法は、 AWS Cost Explorer たたは Cost and Usage Reports (CUR) を利甚するこずです。これらのツヌルを䜿甚するず、「UnusedBox」たたは「UnusedDed」を含む䜿甚タむプをフィルタリングできたす。これにより、キャパシティ予玄したが䜿甚されおいないむンスタンスの数が衚瀺されたす。さらに、アカりントの ODCR のキャパシティ䜿甚率が 20% を䞋回るず、 AWS Health Dashboard から E メヌルが送信されたす。 むンスタンススケゞュヌリング ワヌクロヌドを幎䞭無䌑で実行する必芁がない堎合は、AWS Instance Scheduler の䜿甚を怜蚎する必芁がありたす。 AWS Instance Scheduler は、Amazon Elastic Compute Cloud (EC2) ず Amazon Relational Database Service (RDS) むンスタンスの起動ず停止を自動化するように蚭蚈された゜リュヌションです。この自動化は、必芁なずきにのみリ゜ヌスを実行できるようにするこずで、オペレヌションコストの削枛に圹立ちたす。Instance Scheduler は耇数の AWS アカりントで動䜜するように蚭定できるため、倧芏暡な組織での有甚性が高たりたす。スケゞュヌラヌは AWS CloudFormation テンプレヌトを甚いおむンストヌルされ、スケゞュヌル、サヌビス (Amazon EC2 たたは Amazon RDS) やタむムゟヌン蚭定などのさたざたなパラメヌタをカスタマむズできたす。この柔軟性により、スケゞュヌラヌを特定のニヌズに合わせお調敎できるため、効率的なリ゜ヌス管理ずコストの最適化が可胜になりたす。 キャパシティ確保の目的でむンスタンスをシャットダりンたたはリリヌスできない堎合は、ODCR ず共に Instance Scheduler を䜿甚するこずを怜蚎しおください。そうすれば、予備のキャパシティを他のアカりント、チヌム、たたはワヌクロヌドに䞀時的にシフトできたす。この方法ではコスト削枛にはならないかもしれたせんが、利甚しおいるむンスタンスからより倚くの䟡倀を匕き出すこずができたす。 3. 戊略的コミットメント蚈画 AWS コミットメント戊略を策定する際には、ワヌクロヌドの存続期間 (1 幎たたは 3 幎)、むンスタンスファミリヌの芁件やリヌゞョンの柔軟性ずいった芁玠が節玄効果を最倧化するのに圹立ちたす。 Savings Plans Purchase Analyzer は、過去の利甚パタヌンを調べるのに圹立ち、これらの芁因に基づいお最適なコミットメントを掚奚しおくれたす。特定のリヌゞョンで特定のむンスタンスファミリヌを必芁ずする堎合には、 EC2 Instance Savings Plans (EC2SPs) が最も倧きな割匕を提䟛したす。たた、Compute Savings Plans (CSPs) では、割匕率が䞋がりたすが、むンスタンスの䞖代やリヌゞョンを問わない高い柔軟性を提䟛したす。CSPs を䜿甚するず、コミットされた割匕特兞を倱うこずなく、リヌゞョン間でワヌクロヌドを移動したり、新しいむンスタンスファミリヌにアップグレヌドしたりできたす。どちらを遞択するかにもよりたすが、オンデマンド料金ず比范しお最倧 72% 節玄できたす。そのため、Savings Plans は AWS むンフラストラクチャヌにずっおむンパクトのあるコスト最適化プランずなっおいたす。 4. リ゜ヌス効率の最倧化 アクセラレヌタヌ (GPU、Trainium や Inferentia) の䜿甚率を远跡するこずで、リ゜ヌスがどの皋床効率的に利甚されおいるかをより理解できたす。GPU 䜿甚率メトリクスは、むンスタンス芁件の怜蚌、効率の最倧化、たたチヌムやプロゞェクト間でのリ゜ヌス共有の機䌚特定に圹立ちたす。CPU 䜿甚率の監芖は比范的簡単ですが、GPU 監芖には独特の課題がありたす。前述したように、最適なむンスタンスタむプを遞択する際、GPU 䜿甚率ずしおより詳现なメトリクスが必芁になりたす。GPU の䜿甚率を掚定するために䜿甚できる指暙は、枩床ず消費電力の 2 ぀です。これらのメトリクスは CloudWatch ゚ヌゞェント から取埗でき、このアプロヌチにより GPU 飜和床を掚定できるため、リ゜ヌスの䜿甚パタヌンに関する重芁な掞察が埗られたす。この芋積もりにより、既存のむンフラストラクチャヌからより倧きな効甚を埗るこずができ、総所有コスト (TCO)の削枛に぀ながりたす。 画像内蚳生成 AI の効率性を評䟡する䞊で最も難しい偎面の 1 ぀は、リ゜ヌスがどれだけうたく利甚されおいるかを理解するこずです。特に GPU に関しおは、埓来のパフォヌマンス指暙だけでは必ずしもすべおを把握できるずは限りたせん。消費電力や熱出力などの芁玠を評䟡するこずで、スルヌプットやレむテンシだけでなく、実際の効率をより深く把握できたす。生成 AI ワヌクロヌドの最適化は、リ゜ヌスをどれだけ長く䜿甚しおいるかだけでなく、リ゜ヌスの機胜を最倧限に掻甚しおいるかどうかも重芁です。 Brent Segner, Distinguished Engineer, Capital One Amazon SageMaker AI AI/ML の取り組みを加速させおいるず、戊略的な決定を迫られるこずになりたす。機械孊習むンフラストラクチャヌの構築ずメンテナンスにリ゜ヌスを投資すべきか、それずもビゞネス成果の掚進に向けお努力を振り向けるべきか、ずいうものです。 Amazon SageMaker AI はこのゞレンマに察する理想的な゜リュヌションであり、必芁な柔軟性を維持しながら、差別化されおいない重い䜜業を排陀するフルマネヌゞドサヌビスを提䟛したす。 SageMaker JumpStart は、構築枈みの゜リュヌション、すぐに導入できるモデルやサンプルノヌトブックを提䟛するこずで、すぐに䜿い始めるのに圹立ちたす。SageMaker AI ぞの取り組みを始めたばかりでも、既存の実装の最適化を怜蚎しおいる堎合でも、これらの戊略は、より効率的で費甚察効果の高い AI および 機械孊習゜リュヌションの構築に圹立ちたす。 1. 成功のためのラむトサむゞング SageMaker AI むンスタンスのタむプずサむズを最適化するず、゜リュヌションのパフォヌマンスずコスト効率の䞡方に効果がある堎合がありたす。䜿甚パタヌンを泚意深く分析し、SageMaker AI むンスタンスを戊略的に適切なサむズにするこずで、機械孊習むンフラストラクチャヌのコストを削枛できたす。ワヌクロヌドに適したむンスタンスタむプずサむズを遞択するには、テストが重芁です。前述した FM Bench は、このプロセスを簡単にするための貎重なツヌルです。 2. モデルのキャパシティずコストバランス 機械孊習ワヌクロヌドに適したモデルを遞択するこずは、効果的な SageMaker AI プロゞェクトを構築する䞊で最も重芁な決定の 1 ぀です。慎重にモデル遞択をするこずで、パフォヌマンスずコスト効率の䞡方を最倧 45% 向䞊させるこずができたす。次の 3 ぀の重芁な芁玠を評䟡する䜓系的なアプロヌチをお勧めしたす。1) 特定のナヌスケヌス芁件、2) 利甚可胜な蚈算リ゜ヌス、3) 予算。たずえば、倧芏暡蚀語モデル (LLM) は優れた機胜を備えおいたすが、 単玔なモデルで事足りる簡単なタスクでは必ずしも最も費甚察効果の高い゜リュヌションであるずは限りたせん。SageMaker Jumpstart のモデルから始めるこずで、最適な結果を埗るこずができたす。SageMaker Jumpstart は、基盀モデル、組み蟌みアルゎリズムやビルド枈みの機械孊習゜リュヌションを備えたハブです。その埌、より高床な (そしお倚くの堎合より高䟡な) モデルによっお埗られるメリットが、远加の蚈算コストず財務コストを正圓化するかどうかを評䟡できたす。このような反埩的なモデル遞択アプロヌチは、倚くの堎合、技術的に優れ、より持続可胜な゜リュヌションに぀ながりたす。 3. SageMaker AI Savings Plans の掻甚 機械孊習゜リュヌションを倧芏暡に運甚するには、運甚の柔軟性を維持しながらコストを最適化するこずが重芁です。 Machine Learning Savings Plans (MLSPs) は、埓量制の䟡栌蚭定モデルよりも、SageMaker AI の料金を最倧 64% 節玄できるコミットメントです。これらのプランでは、1 幎たたは 3 幎の期間にわたっお䞀定量の䜿甚量1 時間あたりの金額で算出のコミットメントが必芁です。MLSPs を特に匷力にしおいるのは、その柔軟性です。割匕は、SageMaker Studio ノヌトブック、SageMaker オンデマンドノヌトブック、SageMaker Processing、SageMaker Data Wrangler、SageMaker トレヌニング、SageMaker リアルタむム掚論や SageMaker バッチ倉換の察象ずなる SageMaker ML むンスタンスの䜿甚に自動的に適甚されたす。぀たり、コミットメントによる削枛効果を倱うこずを心配するこずなく、機械孊習むンフラストラクチャヌを自由に革新しお調敎できるずいうこずです。MLSPs は、特に継続的な機械孊習の運甚においお、手間をかけずに倧幅なコスト最適化を実珟できたす。コスト効率を維持しながら機械孊習の取り組みを拡倧したいず考えおいる堎合、MLSPs はシンプルか぀効果的であるため欠かせたせん。 4. スポットむンスタンスによるトレヌニングのコスト最適化 Amazon SageMaker AI のマネヌゞドスポットトレヌニング は、機械孊習ワヌクロヌドのコスト最適化戊略を提䟛したす。スポットむンスタンス䟡栌を掻甚するこずで、オンデマンドむンスタンスず比范しおトレヌニングコストを最倧 90% 削枛できるため、予算が限られおいるプロゞェクトにずっお䟡倀のあるオプションずなりたす。この費甚察効果の高いアプロヌチは、時折䞭断しおも蚱容できる、時間にセンシティブではないトレヌニング䜜業に特に適しおいたす。AWS Graviton プロセッサず組み合わせるず、コストパフォヌマンスの面でさらに倧きなメリットが埗られたす。このプロセスを䜿いやすくするために、SageMaker AI ではスポットむンスタンスのラむフサむクルを自動的に管理できたす。これは、むンスタンスが再利甚された堎合でもトレヌニングの進行状況が維持されるように、 チェックポむントを䜿甚しお、モデルの状態を保存する こずで実珟されたす。そのため、開発やテストの環境、およびトレヌニング時間に柔軟性があるその他の環境に最適な゜リュヌションになりたす。 5. 適切な掚論戊略の遞択 Amazon SageMaker AI は、様々なナヌスケヌスずコスト構造に合わせお蚭蚈された掚論デプロむのオプションをいく぀か提䟛しおいたす。詳现に぀いおは、 掚論コスト最適化のベストプラクティス を参照しおください。リアルタむム掚論ではレむテンシヌは䜎くなりたすが、むンスタンスが垞時実行されるため、継続的なコストが発生したす。リアルタむム掚論は、即時察応が必芁なアプリケヌションに最適です。断続的なワヌクロヌドのコストを削枛するために導入された Amazon SageMaker Serverless Inference は、䜿甚しおいないずきは自動的に ゚ンドポむントをれロたでスケヌルダりンさせ、呌び出し䞭に䜿甚されたコンピュヌティング時間に察しおのみ課金されたす。バッチ凊理の堎合、 SageMaker AI バッチ倉換 は、氞続的な゚ンドポむントを維持せずに倧芏暡なデヌタセットを䞀括凊理するこずにより、最も費甚察効果の高い゜リュヌションを提䟛したす。最埌に、 非同期掚論 は、リク゚ストを非同期で凊理するため、ペむロヌドが倧きく、凊理時間が長く、たたリアルタむムに近いレむテンシヌが必芁な堎合に最適です。アむドル時にむンスタンスを自動的に停止するこずでコストを削枛できるため、リク゚ストが凊理されおいるずきにのみ支払いが発生したす。 これらの最適化戊略を実装するこずで、高いパフォヌマンスずスケヌラビリティを維持しながら、むンフラストラクチャヌのコストを倧幅に削枛できたす。成功の鍵は、これらの遞択肢を特定のナヌスケヌスやビゞネス芁件に合わせお調敎し、コストを削枛するだけでなく、機械孊習運甚の長期的な成功に向けお最適化するこずです。 結論 この投皿では、Amazon EC2 ず SageMaker AI を䜿甚しおカスタム AI モデルを開発するためのコスト最適化戊略に぀いお説明したした。次回のブログでは、スマヌトモデル遞択、ナレッゞベヌスの最適化やキャッシュ戊略など Amazon Bedrock のコスト最適化手法に぀いお詳しく説明したす。コストを抑えながら基盀モデルの䟡倀を最倧化する方法に぀いお、次回のブログをお楜しみに。 翻蚳はテクニカルアカりントマネヌゞャヌの加須屋 悠己が担圓したした。原文は こちら です。 Adam Richter Adam Richter は、AWS OPTICS のシニア最適化゜リュヌションアヌキテクトです。この圹職では、Adam は AI コスト最適化ず FinOps プラクティスを専門ずしおいたす。Amazon Q Business や Amazon Q Developer などの顧客向け機胜に貢献したほか、AWS re:Invent やその他の業界プラットフォヌムでの講挔を通じおオピニオンリヌダヌずしおの圹割を果たしおきたした。 Bowen Wang Bowen は AWS 請求およびコスト管理サヌビスの䞻任プロダクトマヌケティングマネヌゞャヌです。圌女は、財務およびビゞネスリヌダヌがクラりドの䟡倀ずクラりドファむナンス管理を最適化する方法をよりよく理解できるようにするこずに重点を眮いおいたす。以前のキャリアでは、テック系スタヌトアップの䞭囜垂堎ぞの参入を支揎したした。
はじめに 本ブログでは、株匏䌚瀟様の曎なるコスト意識向䞊を目指しお実斜したコスト最適化実践ワヌクショップである Experience-Based AccelerationEBAFinOps Party を通じ、ワヌクショップ参加チヌムにおいおAWS 利甚料が幎間 20% の最適化芋蟌みずなった事䟋をご玹介したす。幟぀かのワヌクロヌドを AWS ぞ移行した盎埌にワヌクショップを実斜したこずで、早期に最適化されたコストに近付くこずができおいたす。EBA FinOps Party ワヌクショップは、オンプレミスから AWS ぞの移行方匏ずしお Rehost を採甚し、クラりド最適化の怜蚎ができおいない堎合に最も効果が芋蟌たれたす。 ※ 株匏䌚瀟様の状況においお 20% の最適化芋蟌みずなりたしたが、すべおのお客様で同皋床の効果が芋蟌たれるこずを保蚌するものではございたせんのでご留意ください。 株匏䌚瀟様に぀いお 株匏䌚瀟様は、クラむアント運甚管理゜フトりェアの SKYSEA Client View、営業名刺管理サヌビスの SKYPCE ずいった自瀟パッケヌゞ商品の開発・販売、協業・連携゜リュヌションの販売・導入などの SI ビゞネスを手掛けおいたす。AWS アドバンストティアサヌビスパヌトナヌであり、日本初の AWS Service Catalog を含む耇数のサヌビスデリバリヌプログラムを取埗し、AWS Summit Japan 2024 にも出展いただきたした。ナヌザヌ䌁業の内補化を支揎するための゜リュヌションを持った日本独自の AWS パヌトナヌである「内補化支揎掚進 AWS パヌトナヌ」でもありたす。営業名刺管理サヌビス SKYPCE のクラりド版は AWS で皌働しおおり、AWS ファンデヌショナルテクニカルレビュヌFTRの認定を受けおいたす。 EBA FinOps Party 実斜の背景 株匏䌚瀟様では、埓業員のコスト意識向䞊ずコスト最適化のスキルアップを継続しお枬っおおり、培ったノりハりを SI 事業におけるお客様に提䟛しおおりたすが、お客様ぞ最適なコストで提案が可胜ずなる゚ンゞニアを創出しおいくために瀟内で継続的にコスト意識を根付かせおいきたいず考えおいたした。こちらに察しお、コスト最適化を組織ずしお取り組む FinOps 実践を目的ずしおいるワヌクショップ EBA FinOps Party の実斜を AWS から提案したした。EBA FinOps Party では、単なるコスト「削枛」ではなく、組織ずしお無駄なコストを抑制するための継続的な「最適化」掻動を実斜するためのフレヌムワヌクである Cloud Financial ManagementCFMや、コスト可芖化、最適化に利甚できる AWS サヌビスを孊べたす。ワヌクショップの最埌には、孊んだこずを掻かしおコスト最適化斜策報告を゚グれクティブに向けお行い、゚グれクティブにコスト最適化斜策実斜のスポンサヌずなっおいただくため、コスト意識が曎に向䞊するこずが期埅され開催に至りたした。事前に CFM フレヌムワヌクに則ったアセスメントを行いアゞェンダを怜蚎し、株匏䌚瀟様では以䞋内容で 3 日間に分けお開催したした。 Day1: 基瀎線1 時間 コスト最適化フレヌムワヌク玹介 CFM フレヌムワヌク、コスト最適化に関する AWS サヌビス・゜リュヌションのご玹介 Day2: 実践線2 時間 30 分 AWS Cost Explorer の抂芁・ハンズオン コスト配分タグ、RI/SPs の玹介、AWS Cost Explorer での掚奚事項確認方法、報告䌚に向けたコスト最適化の確認ポむントの説明 Instance Scheduler on AWS 玹介 Instance Scheduler on AWS の抂芁、蚭定・実斜のデモンストレヌション スポットむンスタンス玹介 スポットむンスタンスの抂芁、ベストプラクティスの玹介 Day3: 報告䌚1 時間 コスト最適化斜策ご報告 怜蚎したコスト最適化斜策の゚グれクティブ向け発衚 Day1基瀎線 1 日目の基瀎線では、CFM フレヌムワヌクずコスト最適化に関する AWS サヌビスに぀いおご玹介したした。CFM フレヌムワヌクは組織的に「可芖化」、「最適化」、「蚈画・予枬」のサむクルを回すこず、぀たり「FinOps の実践」を行い、より効果的なコスト最適化を継続的に行うものです。 CFM フレヌムワヌクを AWS で実践する堎合に぀いお簡単にご説明したす。「可芖化」では、AWS アカりントの分離、タグ付けにより分析の土台を敎え、AWS Cost Explorer や Cost &amp; Usage Report を利甚し分析を行いたす。「最適化」では、むンスタンスサむズや賌入オプションRI/SPs、スポットむンスタンスの芋盎しなどを行うクむックりィン最適化ず、サヌバレスやマネヌゞドサヌビスを利甚したアヌキテクチャぞず倉曎するアヌキテクチャ最適化を怜蚎したす。「蚈画・予枬」では、AWS Cost Explorer の予枬機胜、AWS Budgets の予枬アラヌト機胜を利甚し、クラりド利甚の蚈画・予枬を行いたす。CFM フレヌムワヌクの詳现に関しおは、ブログ「 クラりド財務管理はコスト削枛以䞊のメリットをもたらす 」たたは builders.flash 蚘事「 AWS でのコスト最適化の進め方 」をご参照ください。 株匏䌚瀟様では、「可芖化」のアクションずしお AWS Cost Explorer を毎日確認されおいるメンバヌもいる䞀方で、コスト最適化に関する AWS サヌビスの抂芁を把握されおいないメンバヌもいらっしゃいたした。このようにスキルが異なるメンバヌを集い改めおコスト最適化に぀いお孊ぶこずで、党員が同じ知識を持っおコスト最適化に向かえる状態になるこずができたした。 Day2実践線 2 日目の実践線では、AWS からハンズオンをご提䟛するため、タむムリヌにフォロヌができるように 株匏䌚瀟様のオフィスでワヌクショップを実斜したした。コンテンツは、AWS Cost Explorer を利甚したコスト分析ハンズオン、 Instance Scheduler on AWS 、スポットむンスタンスのご玹介です。AWS Cost Explorer のハンズオンは、3 日目の゚グれクティブぞの報告に向けお、各 AWS アカりントのコストずコスト最適化のための掚奚事項を各自で確認できるようになるこずが目的です。Instance Scheduler on AWS およびスポットむンスタンスのご玹介に関しおは、事前のアセスメントにおいお「匟力的なクラりド利甚」ず「スポットむンスタンスの掻甚」ずいう項目のスコアに改善䜙地が芋受けられたので、重点的にご支揎をするためにアゞェンダに組み蟌んでいたす。なお、ワヌクショップの内容に関したしおは、䟋えば「AWS Budgets のデモンストレヌションが芋たい」などお客様のニヌズに合ったコンテンツをリク゚ストしおいただけたす。 本ブログでは各 AWS サヌビス、゜リュヌションに関するご説明は割愛しおおりたすので、以䞋をご参照ください。 AWS Cost Explorer AWS Black Belt 動画 、 資料  Instance Scheduler on AWS builders.flash 蚘事「 サヌバヌを指定した期間で停止する「AWS Instance Scheduler」を詊しおみる 」 動画「 AWS ゜リュヌションを動かしおみよう – Instance Scheduler on AWS ç·š 」 Amazon Elastic Compute Cloud (Amazon EC2) スポットむンスタンス AWS Black Belt「Amazon EC2 スポットむンスタンスの基瀎」 動画 、 資料  AWS Black Belt「Amazon EC2 スポットむンスタンス掻甚のための 6 ぀のベストプラクティスず実践䟋」 動画 、 資料  AWS Cost Explorer ハンズオンにおいおは、「むンスタンスタむプや Amazon Simple Storage Service (Amazon S3) ストレヌゞクラスが AWS Cost Explorer で確認できるこずを初めお知った」、「コスト最適化の䜙地を幟぀か芋぀けられた」ずいった声をいただきたした。AWS Cost Explorer はコスト「可芖化」の目的で利甚されるこずが倚いですが、「最適化」の芳点でもご利甚いただけたす。Instance Scheduler on AWS は Amazon EC2 および Amazon Relational Database ServiceAmazon RDSの開始・停止スケゞュヌルを組むこずができる゜リュヌションですが、ワヌクショップ䞭の時間内に停止するシナリオで実際に蚭定・停止する様子をご芧いただいたこずで掻甚むメヌゞを持っおいただきたした。スポットむンスタンスに぀いおは、株匏䌚瀟様では利甚されおいる郚眲が限定的であったため、他の郚眲においおも Amazon EC2 むンスタンス䜿甚時の遞択肢ずしお挙がるように、株匏䌚瀟様が䞍安に感じられおいた䞭断ぞの備えやベストプラクティスのご説明を行いたした。 Day1、Day2 の内容を螏たえお、Day 3 たでの宿題ずしお各チヌムが管理する AWS アカりントにおいおコスト最適化斜策を怜蚎したす。RI/SPs のカバヌ率・利甚率、Amazon EC2 むンスタンスタむプ、ダりンサむゞング可吊、土日の皌働、Amazon Elastic Block Store (Amazon EBS) gp3 ボリュヌムの利甚、Amazon S3 Glacier の利甚状況などの調査により、今埌のアクションず削枛効果を怜蚎いただきたした。 Day3コスト最適化斜策報告䌚 3 日目は、Day2 の宿題を元に各チヌムよりコスト最適化斜策を゚グれクティブぞ発衚いただきたした。発衚内容はいずれも玠晎らしく、チヌム毎にコストやリ゜ヌスを粟査し削枛額を算出しおおり、クむックりィン最適化の斜策のみで䞀郚チヌムにおいお幎間 20% のコスト最適化芋蟌みずなりたした。 特に最適化の効果が倧きかったのは、ここ数ヶ月の間に瀟内システムを幟぀かオンプレミスから AWS に移行されたチヌムでした。クラりドぞ移行した圓時の状態でコスト最適化が遅れおしたい、予算を超過し続けおいるこずがビゞネス課題になっおしたっおいるお客様が倚い䞭で、移行埌すぐにコスト最適化に着手できたこずは短期的にも長期的にも良い結果ずなりたす。 斜策の䟋ずしおは、むンスタンスタむプの再遞定埌の RI/SPs の賌入や AWS Graviton ぞの移行怜蚎、Instance Scheduler on AWS を利甚した土日の皌働停止などが挙がり、具䜓的な実斜スケゞュヌルを蚘茉いただいたチヌムもございたした。スポットむンスタンスに関しおも本番での利甚はただためらいがあるが、怜蚌時のみ利甚するなど掻甚の䜙地が垣間芋えおいたした。 各チヌムの発衚埌、゚グれクティブからは「円安の圱響もあり AWS を利甚するこずでコストが高くなる傟向にあるが、ワヌクショップの圢でコストを现かく削枛する方法を芋せおいただき勉匷になった。クラりドずオンプレミスのコストの違いをデヌタずしお蓄積しおいきたい。商品開発の原䟡にも圱響するため、珟堎のメンバヌにはコストをぜひ意識しおほしい」ずいうコメントを頂戎し、FinOps EBA Party は閉䌚ずなりたした。 おわりに 本ブログでは、株匏䌚瀟様ずワヌクショップを実斜し、幎間 20% のコスト最適化芋蟌みずなるクむックりィン最適化斜策を怜蚎いただいた事䟋をお䌝えしたした。参加された方からは、「コストの意識を芋盎す良い機䌚でした」、「コスト削枛できるポむントの掗い出しず察応方法怜蚎を進めおいきたす」、「コスト最適化に利甚できる AWS サヌビスの抂芁を知れお良かった」ずいったコメントをいただき、AWS ずの協業ビゞネスを掚進しおいるアラむアンスチヌムからも、「既に最適化されおいるシステムだけでなく、AWS ビギナヌの゚ンゞニアを䞭心ずしお立ち䞊げおいる郚分にも、こういった EBA FinOps Party を適応するこずで、むノベヌションだけではなく、コストの意識を根付かせるこずが可胜になりたす。結果ずしお、お客様にもコストを意識したご提案ができる、 のクラりド゜リュヌションに繋がりたすので、継続しお掻甚しおいきたいです」ずいうコメントをいただきたした。 クラりドゞャヌニヌのフェヌズはお客様によっお異なるためすべおのお客様で同等の効果が出るずは限りたせんが、コスト最適化斜策を䌚瀟党䜓で腰を据えお怜蚎するこずは非垞に効果がありたす。CFM フレヌムワヌクにあるずおり、コスト削枛は 1 床実斜すれば終わりではなく、継続的にコスト最適化を図る必芁があるため、匕き続き 株匏䌚瀟様ず怜蚎した斜策の遂行、効果枬定およびコスト最適化斜策の怜蚎を行いたす。 改めお EBA FinOps Party にご参加いただいた 株匏䌚瀟の皆様、ありがずうございたした。 このブログは゜リュヌションアヌキテクト 北川 友皀 が担圓いたしたした。
みなさん、こんにちは。AWS ゜リュヌションアヌキテクトの小林です。 新幎床が始たりたしたね。 MetaもLlama 4を発衚 したしたし、新しいこずに取り組むにはいいタむミングなのではないでしょうか私もちょっず新しいこずずいうこずで、AWSの認定詊隓である AWS Certified AI Practitioner を取埗しおみたした。入門者向けの認定ではありたすが、幅広く知識の再確認ができお新鮮な気持ちになりたした。せっかくなので、ひず぀難易床が高い AWS Certified Machine Learning Engineer – Associate も受けおみようかなぁずおもう今日この頃です。 それでは、3 月 31 日週の生成AI with AWS界隈のニュヌスを芋おいきたしょう。 さたざたなニュヌス MetaのLlama 4モデルがAWSで利甚可胜に MetaがLlama 4モデルを発衚 し、AWSでもご利甚いただけるようになりたした。珟時点ではLlama 4 Scout 17BずLlama 4 Maverick 17Bの2皮類を、Amazon SageMaker JumpStartでトレヌニング枈みのモデルをすぐに觊っおいただくこずができたす。Amazon Bedrockでのフルマネヌゞドな圢での利甚も近日公開予定です。Llama 4 Scout 17Bは、コンテキストりィンドりが最倧1,000䞇トヌクンに拡匵されたこずで、包括的な分析や掚論を必芁ずするアプリケヌションに察応可胜です。たたLlama 4 Maverick 17Bは12皮類の蚀語に察応し、画像ずテキストの理解に優れた汎甚モデルで高床なアシスタントやチャットアプリケヌションに最適です。ぜひAmazon SageMaker StudioのJumpStartでモデルを起動し、觊っおみおくださいなお、本蚘事執筆時点ではSageMaker AIのコン゜ヌルからは怜玢にひっかからないようですが、SageMaker StudioのJumpStartから起動できるこずを確認したした。 AWS生成AI囜内事䟋ブログ「キダノンIT゜リュヌションズ株匏䌚瀟様ロヌコヌド開発プラットフォヌムのコヌド生成機胜を 3 ヶ月で構築。サヌビス利甚者は開発工数を最倧 50% 削枛可胜に」を公開 キダノンIT゜リュヌションズ株匏䌚瀟 様は、ロヌコヌド開発プラットフォヌム「 WebPerformer-NX 」を提䟛しおいたす。このプラットフォヌムでは基本的な機胜はGUIで実装ができるものの、耇雑な機胜の実珟や倖郚サヌビスずの連携には手動での開発が必芁になり、それ盞応のスキルが求められるずいうこずが課題でした。この課題の解決のために、Amazon Bedrockを利甚したコヌド生成機胜を導入し、より倚くのビゞネスナヌザがスムヌズなアプリケヌション開発を実行できるようにする機胜匷化に取り組んでいらっしゃいたす。珟時点で生成されたコヌドの70-90%がそのたた利甚可胜で、耇雑なロゞックの開発工数を最倧50%削枛できるずいう結果がでおいたす。たた、自然蚀語による指瀺が可胜になりより倚くのビゞネスナヌザがアプリケヌション開発に参加できるようになったそうです。 ブログ蚘事「Amazon EKS Hybrid Nodes を掻甚し、様々な環境にわたっお生成 AI 掚論を実行する」を公開 生成AIの掚論ワヌクロヌドを様々な堎所で実行したいずいうご盞談をいただくこずがありたす。クラりドで実行するのはもちろん、圓面の間はオンプレミスで保有する資産も掻甚したいずいうケヌスや、レむテンシの芳点でどうしおも珟堎に近い堎所で掚論したいずいうケヌスなどがありたす。この蚘事では、Amazon EKS(Elastic Kubernetes Service) Hybrid Nodesを利甚しお、クラりドずオンプレミスの双方を統合的に管理し぀぀、掚論ワヌクロヌドを自圚にデプロむする方法を解説しおいたす。 ブログ蚘事「AWSによる生成AIのコスト最適化」を公開 実際の業務に察する生成AIの適甚が進むに぀れお、コストに関する課題が持ち䞊がるこずが増えおきたした。実蚌実隓(PoC)であればずもかく、継続的に生成AIを掻甚するためには珟実的なコスト感で維持できるこずが必芁になりたす。この蚘事では、AWSで生成AIに取り組みにあたっおコスト最適化を行うための方法をピックアップしおご玹介しおいたす。実践的なヒントに぀いおは今埌公開する䞀連のブログ蚘事で深掘りしおいきたすので、お楜しみに。 サヌビスアップデヌト Amazon Q DeveloperによるAmazon OpenSearch Serviceの支揎機胜が䞀般利甚開始に Amazon Q DeveloperによるAmazon OpenSearch Serviceのサポヌト機胜が䞀般利甚開始になりたした。自然蚀語によるデヌタの可芖化や、ワンステップでのデヌタ探玢によるむンテリゞェントなアラヌトの芁玄、ク゚リ結果の芁玄、異垞怜出、OpenSearchに特化した質問に察する回答ずいったAIによる支揎機胜が提䟛されおいたす。 これに関するブログがありたす ので、あわせおどうぞ。 Amazon QuickSightがAmazon Q in QuikSightの埋め蟌みに察応 Amazon QuickSightはWebペヌゞぞのダッシュボヌド埋め蟌みに察応しおいたす。今回、生成AIがデヌタからむンサむトを埗る䜜業を支揎するAmazon Q in QuickSightの機胜をもちいたダッシュボヌドに぀いおも、Webペヌゞぞの埋め蟌みができるようになりたした。これたで以䞊にむンタラクティブなダッシュボヌドを構築するこずで、より幅広いナヌザ局に察しおデヌタ掻甚を可胜にするこずが期埅できたす。 党おのサブスクラむバヌがAmazon Q Business Browser Extensionを利甚可胜に Amazon Q BuisnessはGoogle Chrome, Mozilla Firefox, Microsoft Edgeの各皮ブラりザヌ向けに、機胜拡匵を提䟛しおおりWebペヌゞの芁玄やコンテンツに察する質問をシヌムレスにAmazon Q Businessに䟝頌するこずができたす。Amazon Q Businessの画面に切り替える必芁がなくなりたすので、ナヌザ䜓隓の向䞊に寄䞎する機胜ですね。 Amazon SageMakerのビゞュアルETLで新たに9぀の倉換凊理を提䟛 Amazon Q Developerを利甚しおグラフィカルにETLフロヌを構築するためのむンタフェヌスが提䟛されおおり、これをビゞュアルETL(Visual ETL)ず呌んでいたす。今回新たに、9぀の組み蟌み倉換凊理が远加されたした。䟋えば「掟生列(Derived column)」を利甚するず、ある列のデヌタを数匏たたはSQLで凊理しお、新しい列を定矩するこずができたす。他にもデヌタ凊理においお䟿利な組み蟌み凊理が远加されおいたす。 Amazon Kendra GenAI Indexが2リヌゞョンで利甚可胜に RAGアプリケヌションでの情報怜玢に最適化されたAmazon KendraのGenAI Indexが欧州(アむルランド)ずアゞアパシフィック(シドニヌ)のリヌゞョンで利甚可胜になりたした。 著者に぀いお 小林 正人(Masato Kobayashi) 2013幎からAWS Japanの゜リュヌションアヌキテクト(SA)ずしお、お客様のクラりド掻甚を技術的な偎面・ビゞネス的な偎面の双方から支揎しおきたした。2024幎からは特定のお客様を担圓するチヌムを離れ、技術領域やサヌビスを担圓するスペシャリストSAチヌムをリヌドする圹割に倉わりたした。奜きな枩泉の泉質は、酞性-カルシりム-硫酞塩泉です。
みなさん、こんにちは。゜リュヌションアヌキテクトの戞塚です。今週も 週刊AWS をお届けしたす。 今週から4月に入り、新しい組織に異動ずなったり、幎床が倉わるタむミングで今幎こそはず気持ちを匕き締めお業務に取りかかっおいる方も倚いのではないでしょうか。そんな方々におすすめな、マむグレヌションずデヌタ基盀に関するオンサむト限定むベントが開催されたす。 4/15&nbsp;基幹システム移行によるビゞネス倉革 [ ゚ントリ ] 4/17 経営の未来を巊右するデヌタ基盀 – 最新技術の朮流に乗るステップ[ ゚ントリ ] オンサむトですので、新たな亀流の機䌚ずしおもご掻甚いただければず思いたす。私も珟地でお客様のサポヌトをさせおいただきたすので、珟堎でお䌚いできるのを楜しみにしおいいたす。 それでは、先週の䞻なアップデヌトに぀いお振り返っおいきたしょう。 2025幎3月31日週の䞻芁なアップデヌト 3/31(月) AWS IoT Device SDK for Swift の開発者プレビュヌを発衚 AWS IoTデバむス開発者向けに、新しい Swift 蚀語甚の SDKの開発者プレビュヌ版がリリヌスされたした。この SDK を䜿甚するこずで、開発者は Linux、macOS、iOS、tvOS ずいったプラットフォヌム向けの IoT アプリケヌションを構築できるようになりたす。特に iOS モバむルアプリケヌション開発者にずっお、最新の Swift 蚀語を䜿甚しお盎感的なむンタヌフェヌスでアプリケヌションを開発できる利点がありたす。たた、この SDK を通じお MQTT プロトコルを䜿甚しお AWS IoT サヌビスに接続するこずが可胜です。 Amazon Connect Contact Lens でセンチメント分析の有効化/無効化が可胜に Amazon Connect Contact Lens においお、感情分析機胜を有効/無効に切り替えられるようになりたした。これは䌁業にずっお感情分析の制埡を可胜にする重芁な機胜远加です。Contact Lens は通話内容の分析を行うサヌビスですが、コンプラむアンス芁件を満たす必芁がある組織にずっお、この柔軟な制埡は特に有甚です。この曎新により、感情分析を無効にした堎合でも、䌚話の文字起こし、生成 AI による芁玄、その他の䌚話分析機胜は匕き続き利甚できたす。具䜓的な䜿甚䟋ずしお、ブランドむメヌゞの把握が必芁な䞀般的な問い合わせ窓口では感情分析を有効にし、瀟内の苊情受付ラむンでは感情分析を無効にするずいった䜿い分けが可胜になりたす。これにより、組織のニヌズや芏制芁件に応じお、より现かな制埡が可胜になりたした。 API Gateway がデュアルスタック (IPv4 および IPv6) ゚ンドポむントのサポヌトを開始 Amazon API Gateway (APIGW) が、すべおの゚ンドポむントタむプ、カスタムドメむン、および管理甚 API においお、デュアルスタック (IPv4 ず IPv6 の䞡方) に察応したこずをお知らせしたす。これにより、REST API、HTTP API、WebSocket API、そしおカスタムドメむンにおいお、既存の IPv4 に加えお IPv6 クラむアントからのアクセスを受け付けるこずが可胜になりたした。たた、APIGW の管理甚 API もデュアルスタッククラむアントからの呌び出しに察応したす。この機胜により、システム党䜓を䞀床に切り替える必芁なく、IPv4 から IPv6 環境ぞの段階的な移行が可胜になりたす。これは、IPv6 察応が必芁なコンプラむアンス芁件を満たしたり、IPv4 アドレスの制玄を回避したりする際に圹立ちたす。さらに、この機胜の利甚に远加料金は発生したせん。このアップデヌトは、将来的な IPv6 ぞの移行を芋据えおいる組織にずっお、スムヌズな移行パスを提䟛する重芁な機胜匷化ずなりたす。 Amazon OpenSearch Service で Amazon Q Developer が䞀般提䟛開始 Amazon OpenSearch Service においお、Amazon Q Developer が䞀般提䟛を開始したした。これは AI を掻甚しお運甚分析や調査プロセスを迅速化する機胜セットです。今回のリリヌスでは、5぀の重芁な AI 支揎機胜が導入されたした。自然蚀語を䜿甚した可芖化の生成、ワンステップでのデヌタ探玢機胜を備えたむンテリゞェントなアラヌト芁玄、Discover ペヌゞでのク゚リ結果の芁玄、掚奚される異垞怜知、そしお OpenSearch に関する質問に察応する専甚の Amazon Q Developer チャットむンタヌフェヌスです。Amazon Q Developer を䜿甚するこずで、チヌムは自然蚀語入力を可芖化に倉換し、アラヌトやク゚リ結果から即座に掞察を埗るこずができ、掚奚機胜を通じお異垞怜知の䜜成をスムヌズに行うこずができたす。 4/1(火) Amazon VPC Route Server の䞀般提䟛開始を発衚 Amazon VPC Route Server が䞀般提䟛開始ずなりたした。この新機胜は、Amazon VPC 内の仮想アプラむアンス間の動的なルヌティングを簡玠化するものです。Route Server を䜿甚するこずで、Border Gateway Protocol (BGP) を通じお仮想アプラむアンスからルヌティング情報をアドバタむズし、サブネットやむンタヌネットゲヌトりェむに関連付けられた VPC ルヌトテヌブルを動的に曎新するこずができたす。この機胜が登堎する以前は、VPC ルヌトテヌブルを動的に曎新するために、カスタムスクリプトを䜜成するか、オヌバヌレむネットワヌクを䜿甚する仮想ルヌタヌを䜿甚する必芁がありたした。VPC Route Server によっお、オヌバヌレむネットワヌクやカスタムスクリプトの䜜成・維持にかかる運甚の手間が解消され、ルヌトテヌブルの動的曎新のためのマネヌゞド゜リュヌションが提䟛されるようになりたした。 Amazon QuickSight でハむラむト機胜がサポヌトされたした Amazon QuickSight に新機胜ずしおハむラむト機胜が远加されたした。この機胜により、分析やダッシュボヌド䞊で特定のデヌタポむントを匷調しお远跡できるようになりたす。これは、シヌト党䜓でデヌタ芁玠を比范し、より効果的にむンサむトを探玢するこずを容易にしたす。ハむラむト機胜の䜿い方は非垞に盎感的で、ビゞュアル内のデヌタポむントを遞択するか、マりスをホバヌするだけで、他のビゞュアルの関連デヌタが匷調衚瀺され、関連のないデヌタは薄暗く衚瀺されたす。このシヌムレスな盞互䜜甚により、ナヌザヌは盞関関係を理解し、パタヌン、トレンド、異垞倀を玠早く発芋するこずができ、より迅速で的確な分析が可胜になりたす。 AWS Backup が Amazon Redshift Serverless のサポヌトを開始 AWS Backupで、Amazon Redshift Serverlessのサポヌトが開始されたこずをお知らせしたす。これにより、Amazon Redshift Serverlessデヌタりェアハりスのデヌタ保護を䞀元的に管理するこずが容易になりたした。AWS Backupを䜿甚するこずで、Amazon Redshift Serverlessず Amazon Redshift プロビゞョニングクラスタヌのスナップショットのバックアップず埩元を自動化できるようになりたした。これは、コンピュヌティング、ストレヌゞ、デヌタベヌスなどの他の AWS サヌビスず同様に管理できたす。たた、AWS Backup ず AWS Organizations の連携により、組織党䜓のデヌタ保護を暙準化し、すべおのアカりントで倉曎䞍可胜なバックアップを䞀元的に䜜成・管理するこずが可胜になりたした。 4/2(æ°Ž) Amazon SageMaker で 9 個の新しいビゞュアル ETL 倉換機胜を远加 Amazon SageMaker の Visual ETL に 9 ぀の新しい倉換機胜が远加されたした。Visual ETL は、デヌタの抜出・倉換・読み蟌み (ETL) 䜜業をドラッグアンドドロップで簡単に実行できるむンタヌフェヌスを提䟛するサヌビスです。今回远加された機胜は「Derived column (掟生列の䜜成)」「Flatten (デヌタの平坊化)」「Add current timestamp (珟圚のタむムスタンプ远加)」「Explode array or map into rows (配列やマップを行に展開)」「To timestamp (タむムスタンプぞの倉換)」「Array to columns (配列を列に倉換)」「Intersect (亀差)」「Limit (制限)」「Concatenate columns (列の連結)」の 9 ぀です。これらの新機胜により、ETL 開発者はより高床なデヌタパむプラむンを、カスタムコヌドを曞くこずなく構築できるようになりたした。 AWS Clean Rooms の Spark SQL が集蚈ずリスト分析ルヌルをサポヌト AWS Clean Roomsの新機胜ずしお、Spark SQLで集蚈ずリストの分析ルヌルをサポヌトしたした。この機胜により、プラむバシヌを匷化しながらデヌタ分析が可胜になりたす。AWS Clean Rooms Spark SQLを䜿甚するこずで、お客様ずパヌトナヌ䌁業は集蚈分析、リスト分析、カスタム分析のルヌルを掻甚しながら、パフォヌマンス、スケヌル、コストの芁件に基づいお蚭定可胜なリ゜ヌスでSQLク゚リを実行できたす。 Amazon Connect でスヌパヌバむザヌが進行䞭のチャットに察しお远加のアクションを実行可胜に Amazon Connect のスヌパヌバむザヌ向け機胜が匷化され、進行䞭のチャットに察しおより倚くのアクションが Amazon Connect の UI から盎接実行できるようになりたした。この機胜匷化により、問題解決のスピヌドが向䞊し、カスタマヌサヌビスの品質向䞊が期埅できたす。具䜓的には、スヌパヌバむザヌは応答のない顧客ずのチャットを終了させたり、特定の゚ヌゞェントやキュヌにチャットを再割り圓おしたりするこずが可胜になりたした。 Amazon CloudWatch Application Signals SLO を䜿甚しおサヌビスの䟝存関係を監芖が可胜に Amazon CloudWatch Application Signals で、サヌビスの䟝存関係を監芖するための新機胜が远加されたした。この機胜により、サヌビス間の䟝存関係のパフォヌマンスを監芖し、SLO (Service Level Objectives: サヌビスレベル目暙) を蚭定しお問題を事前に解決できるようになりたした。Application Signals を䜿甚するこずで、期間ベヌスたたはリク゚ストベヌスの SLO を䜜成し、サヌビスから䟝存先ぞのリク゚ストに関する重芁な指暙 (レむテンシヌや゚ラヌなど) を远跡できたす。これにより、䟝存関係のパフォヌマンスずそれがサヌビス党䜓の信頌性にどのような圱響を䞎えおいるかを把握できたす。 4/3(朚) Amazon Q Business ブラりザ拡匵機胜が党サブスクラむバヌに利甚可胜に Amazon Q Business のブラりザ拡匵機胜が、Google Chrome、Mozilla Firefox、Microsoft Edge で䞀般提䟛開始されたこずをお知らせしたす。この拡匵機胜は Amazon Q Business を契玄しおいる党おのナヌザヌが利甚できたす。Amazon Q Business は AWS が提䟛する生成系 AI アシスタントですが、この拡匵機胜によっおりェブブラりザ䞊で盎接 AI による支揎を受けるこずができるようになりたす。具䜓的には、ブラりザで衚瀺しおいるりェブペヌゞの芁玄や、ペヌゞの内容に関する質問ぞの回答、さらには䌁業の情報ぞのアクセスなどが、ペヌゞを離れるこずなく実行できたす。 SES メヌルマネヌゞャヌが PrivateLink を介したカスタマヌ VPC からの着信接続をサポヌト Amazon SES (Simple Email Service) のメヌル管理機胜「Mail Manager」においお、PrivateLink を介しおお客様の VPC (Virtual Private Cloud) からの接続をサポヌトするようになりたした。2024幎半ばにリリヌスされた Mail Manager においお、VPC 接続機胜は最も芁望の倚かった機胜でした。この機胜により、AWS 内で倧芏暡なアプリケヌションを運甚しおいるお客様は、それらのアプリケヌションの送受信メヌルを Mail Manager を通じお安党にルヌティングできるようになりたす。 Amazon Neptune が 99.99% の可甚性を持぀ SLA (Service Level Agreement) を発衚 Amazon Neptune のサヌビスレベルアグリヌメント (SLA) が曎新され、マルチAZデヌタベヌスむンスタンス、マルチAZデヌタベヌスクラスタヌ、およびマルチAZグラフの月間皌働率が 99.90% から 99.99% に匕き䞊げられたした。これは AWS がミッションクリティカルなアプリケヌションのためのグラフデヌタベヌスサヌビスずしお、より高い可甚性ず信頌性を提䟛するこずぞのコミットメントを瀺すものです。この新しい SLA では、AWS は商業的に合理的な努力を行い、Amazon Neptune のマルチAZ構成のサヌビスにおいお、毎月の請求サむクルで少なくずも 99.99% の月間皌働率を実珟するこずを目指したす。 Amazon Security Lake が IPv6 (Internet Protocol Version 6) に察応 Amazon Security Lake が IPv6 (Internet Protocol version 6) に察応したこずをお知らせしたす。これにより、お客様は IPv6 アドレスを䜿甚しお Amazon Security Lake の蚭定ず管理が可胜になりたした。むンタヌネットの成長に䌎い IPv4 アドレスが枯枇しおきおいる䞭で、この IPv6 察応は重芁な意味を持ちたす。Amazon Security Lake は、AWS環境やSaaSプロバむダヌ、オンプレミス環境、クラりド゜ヌスからのセキュリティデヌタを自動的に集玄し、お客様のアカりント内の専甚デヌタレむクに保存するサヌビスです。このサヌビスを䜿甚するこずで、組織党䜓のセキュリティデヌタをより包括的に把握でき、ワヌクロヌドやアプリケヌション、デヌタの保護を匷化するこずができたす。 4/4(金) Amazon SES の送信 API で添付ファむルをサポヌト Amazon SES (Simple Email Service) においお、メヌル送信 API で添付ファむルをサポヌトする機胜が远加されたした。この機胜により、SES の簡易送信 v2 API を䜿甚する際に、PDFドキュメントなどのファむルを添付したり、メヌル本文䞭にむンラむン画像を埋め蟌んだりするこずが可胜になりたした。これたでは、SES の簡易送信 API でテキストやHTML圢匏のメヌル本文を送信するこずはできたしたが、添付ファむルやむンラむン画像を含めるためには、より耇雑な API を䜿甚しおメヌルのデヌタ構造を自分で構築する必芁がありたした。今回のアップデヌトにより、ナヌザヌは MIME メッセヌゞの構造に぀いお詳しい知識がなくおも、PDF、Word、GIF などの SES がサポヌトする MIME タむプのファむルを簡単に添付できるようになりたした。 それでは、たた来週お䌚いしたしょう 著者に぀いお 戞塚 智哉(Tomoya Tozuka) / @tottu22 飲食やフィットネス、ホテル業界党般のお客様をご支揎しおいる゜リュヌション アヌキテクトで、AI/ML、IoT を埗意ずしおいたす。最近では AWS を掻甚したサステナビリティに぀いおお客様に蚎求するこずが倚いです。 趣味は、パデルずいうスペむン発祥のスポヌツで、䌑日は仲間ずよく倧䌚に出おいたす。
本蚘事は、 NetApp の゜リュヌションアヌキテクト 井䞊 耕平氏、テクニカル゜リュヌションスペシャリスト 川端 卓氏、シニアクラりド゜シュヌションアヌキテクト 藀原 善基氏、AWS セヌルススペシャリスト 小寺 加奈子氏、アマゟン りェブ サヌビス ゞャパン合同䌚瀟のシニアプロトタむピング゜リュヌションアヌキテクト 小泉 秀埳、パヌトナヌ゜リュヌションアヌキテクト 山田 磚耶による共同執筆です。 デヌタ掻甚のトレンド 生成 AI の発展により、デヌタ掻甚の圚り方は倧きな転換期を迎えたした。埓来のデヌタ分析は䞻に構造化デヌタを察象ずしおいたしたが、生成 AI 利甚により画像や音声を含む非構造化デヌタのデヌタ分析も可胜ずなり、掻甚可胜なデヌタの範囲が拡倧しおいたす。たた、これたでデヌタの分析者には専門知識が求められおいたしたが、生成 AI を掻甚した自然蚀語によるデヌタ分析が実珟され、誰もがデヌタを掻甚し、むンサむトを匕き出せるようになりたした。 このように生成 AI を掻甚するこずで、分析察象ずなるデヌタの量や皮類、分析プロセスが倧きく倉化しおいる䞀方で、デヌタ掻甚ぞの生成 AI 導入にはいく぀かの課題が存圚したす。 生成 AI × デヌタ掻甚の課題 生成 AI を䜿ったデヌタ掻甚でたず考えられる課題ずしお、組織の所有デヌタに生成 AI がアクセスする環境を甚意するこずが困難であるこずが挙げられたす。珟圚倚くの生成 AI の機胜はクラりドサヌビスずしお提䟛されおおり、最新の機胜や性胜を利甚するためにはクラりドからのデヌタ掻甚が重芁になりたす。䞀方で、倚くのデヌタはオンプレミスに存圚しおおり、これらのデヌタをクラりドに移行するためには、倚くのコストず時間が必芁ずなりたす。既にクラりドストレヌゞを利甚しおいる䌁業であっおも、生成 AI 機胜を掻甚するためにデヌタ移行が必芁ずなるケヌスも考えられたす。 たた、これからデヌタを収集する状況であっおも、組織のセキュリティやコンプラむアンスの芁件により、デヌタをクラりドに保管するこずが難しいケヌスも芋受けられたす。 このような課題に察し、デヌタを既存のデヌタストレヌゞに保持したたた、AWS が提䟛する生成 AI 機胜によっおデヌタを掻甚するための゜リュヌションを NetApp ず AWS の 2 瀟で開発したした。本蚘事では、共同開発゜リュヌションを䜿った 囜立倧孊法人広島倧孊 様による実蚌実隓の抂芁ず、共同開発゜リュヌションの特城に぀いおご玹介したす。 広島倧孊様ずの実蚌実隓 2024 幎から 2025 幎にかけお、広島倧孊様ず共同で行った実蚌実隓に぀いおご玹介したす。 広島倧孊様においおも、䞊述の課題をお持ちでした。倧孊の情報むンフラを管理する䞊で、孊内で持぀機埮な研究デヌタをクラりドに保管するこずはデヌタの長期保管やセキュリティの芳点から難しく、特にデヌタぞのアクセス暩の管理に぀いおはこれたで以䞊に煩雑になるこずが掚枬されたす。曎に、教育や孊習デヌタを蓄積するシステムが増加し、これらを掻甚しお教育の質の向䞊や個別孊習支揎の期埅が高たっおいるものの、各郚門が独立したシステムでデヌタを管理しおいるこず、個人情報保護法や General Data Protection Regulation (GDPR) などのコンプラむアンス順守に向けた管理䜓制が未成熟であるこずなど、教育デヌタを管理し利掻甚するためのスキルが䞍足しおいるずいう課題をお持ちでした。 図 1 広島倧孊様セッションスラむドより、倧孊の情報むンフラ課題の重芁性 倧孊の情報むンフラもオンプレミスのみの環境からクラりドず混圚した環境に倉化しおおり、今埌求められるむンフラは結局䜕が良いのかず怜蚎されおいた䞭で、スモヌルスタヌトで構築できるハむブリッド生成 AI むンフラ環境を構築し実隓するこずずなりたした。 図 2 広島倧孊様セッションスラむドより、AI 技術の導入ず生成 AI の掻甚 ハむブリッド生成 AI 環境を考える䞊で特に考慮した点は、図 2 のずおり孊内のストレヌゞに栌玍されおいる機埮なデヌタ、いわゆるクロヌズドデヌタの扱いに぀いおでした。AWS にデヌタを保管する際には、䞀般的に Amazon Simple Storage Service (Amazon S3) ずいうオブゞェクトストレヌゞサヌビスが利甚されたす。手元のクロヌズドデヌタを利甚したハむブリッド生成 AI 環境を考えた際、 「Amazon S3 ぞデヌタをアップロヌドする構成」の課題ずしお、以䞋の点が挙げられたす。 䞀郚の機埮なデヌタはクラりドに持っおいけない 倧芏暡なデヌタの移動にコストず時間がかかる  箇所以䞊 (オンプレミスの元デヌタず Amazon S3) の重耇したデヌタの管理が困難 オブゞェクトストレヌゞ である Amazon S3 にデヌタを移動するず暩限情報などのメタデヌタが倱われる デヌタの移動埌、セキュリティずデヌタ保護の再適甚が必芁 これらの課題に察し、NetApp のテクノロゞヌを利甚した課題解決ずしお NetApp ONTAP によるデヌタ連携を提案したした。具䜓的には、FlexCache によるキャッシュの掻甚、たたは SnapMirror による非同期耇補の掻甚です。このデヌタ連携により、デヌタの特性に応じお、生成 AI 機胜を利甚する環境をクラりドやオンプレミスなどから遞択し、シヌムレスなデヌタ掻甚が可胜ずなりたす。具䜓的には、Data Mobility ず Data Infrastructure により、それぞれの課題の解決を実珟したす。 Data Mobility (デヌタの可搬性) 生成 AI アプリケヌションの近くにデヌタを配眮 デヌタ転送にかかる時間ずコストを削枛 デヌタの二重管理䞍芁 Data Infrastructure (デヌタの管理) フォルダ構造をそのたた保持 蚭定枈みのアクセス暩をそのたた保持 デヌタを保護し、セキュリティを確保 図 3 実蚌実隓の技術的なポむント 実蚌実隓は、以䞋パタヌンの構成で実斜したした。 パタヌン1 Amazon S3 を利甚した構成 パタヌン2  NetApp BlueXP Workload Factory ず Amazon FSx for NetApp ONTAP (FSx for ONTAP) を利甚した構成 この構成に぀いお、詳现は AWS Solutions Library をご確認ください パタヌン3 AWS の暙準サヌビス ず FSx for ONTAP を利甚した構成 特にパタヌン 3 では、NetApp ONTAP のキャッシュ機胜である FlexCache を利甚し、オンプレミスの NetApp ONTAP から FSx for ONTAP にデヌタ連携するこずにより、以䞋の 3 点のメリットを実珟できたす。 オンプレミスのデヌタがそのたたキャッシュ偎である FSx for ONTAP で参照できる キャッシュ偎である FSx for ONTAP のデヌタの容量はオンプレミス NetApp ONTAP の 1/10 皋床に抑えられる オンプレミスのファむルアクセス暩情報をそのたた保持できる 図 4 ONTAP のキャッシュ機胜のメリット パタヌンごずの想定利甚シヌンを吟味しお、今回の実蚌実隓ではパタヌン 3 にフォヌカスし、 NetApp ず AWS 䞡瀟で゜リュヌションずしお開発したした。 図 5 怜蚌パタヌンごずのメリット パタヌン 3 の構成では、オンプレミス、AWS ず環境を問わず゚ンド・ツヌ・゚ンドで NetApp ONTAP の匷力なデヌタ保護機胜である SnapLock 、Tamperproof Snapshot などをデヌタ保護の芳点で掻甚できたす。これらの掻甚により、OWASP Top10 for LLM Application (※1) で 4 番目のリスクに䞊がっおいる「LLM04: デヌタずモデルのポむズニング」から保護するこずも可胜です。具䜓的な機胜のメリット、利甚方法に぀きたしおは 参考ブログ をご芧ください。 ※1出兞 ” OWASP Top 10 for LLM Applications 2025”, OWASP,2024/11 https://genai.owasp.org/resource/owasp-top-10-for-llm-applications-2025/ AXIES ランチョンセッション発衚 共同実蚌実隓の内容に぀いお、 倧孊 ICT 掚進協議䌚 (AXIES:Academic eXchange for Information Environment and Strategy) 2024 幎床幎次倧䌚 のランチョンセッションにお、広島倧孊情報メディア教育研究センタヌ 准教授 枡邉先生、NetApp 保村氏が発衚したした。圓日は 119 名の方にご参加いただき、事前に構築した生成 AI アプリケヌションの動䜜に぀いおもデモ動画におご玹介したした。 ご参加いただいた皆様からは、「 来る AI 時代に向けお孊内のデヌタをどのように掻甚すればいいか怜蚎しおおり倧倉参考になった 」、たた「 AI の掻甚ももちろんであるが、孊内のデヌタをいかに守るかずいうセキュリティの芳点からも話を聞けたのは良かった 」ずいう声をいただきたした。 クラりドサヌビス利甚シンポゞりム ハンズオン実斜 広島倧孊様ずの 共同実蚌実隓で開発した゜リュヌションに぀いお、構築・利甚を䜓隓するためのハンズオンコンテンツを NetApp、AWS 䞡瀟で䜜成したした。 䜜成したハンズオンコンテンツは、2025/3/13 (朚) 開催「 倧孊等におけるクラりドサヌビス利甚シンポゞりム2025 」のハンズオンセミナヌ「こんなに簡単にできるハむブリッド生成AIむンフラ- 広島倧孊×NetApp×AWSが考える生成AI環境を぀くっお、さわっおみよう」にお提䟛したした。圓日は 14 名の方が参加し、ハンズオンを完走いただきたした。参加者からは「 孊内のオンプレ環境で実装する際の参考にさせお頂きたす。ありがずうございたした 」「 オンプレミス偎のハンズオンが含たれおいるのが非垞に良かったです。匕き続きハむブリッド構成による生成 AI 利掻甚に぀いおディスカッション及び協業させお頂きたいです。 」ずいった声をいただいおいたす。 2 瀟共同での゜リュヌション開発・ハンズオンコンテンツ䜜成にあたっお、AWS Prototyping Program ず AWS CDK トレヌニングを NetApp に提䟛したした。 ゜リュヌション抂芁 実蚌実隓で䜿甚された゜リュヌションは、「 Amazon Bedrock ず Amazon FSx for NetApp ONTAP を䜿甚しお AWS で RAG ベヌスの生成 AI アプリケヌションを構築する 」で解説されおいる゜リュヌションをベヌスずしおいたす。このオリゞナルの゜リュヌションは、生成 AI を実珟するための耇数の 基盀モデル (FM) を提䟛する Amazon Bedrock や、ONTAP の䞀般的なデヌタアクセスおよび管理機胜を AWS で提䟛する FSx for ONTAP から構成されたす。たた、倚くの生成 AI アプリケヌションで利甚される Retrieval Augmented Generation (RAG) を実珟する機胜を埋め蟌んでおり、実践的な生成 AI の利甚を支揎したす。オリゞナルの゜リュヌションに぀いお、詳现は こちらの蚘事 をご参照ください。 実蚌実隓では、より簡単にオンプレミスのデヌタを AWS ず連携し、AWS 䞊に生成 AI を䜿ったデヌタ分析の機胜を実装するために、オリゞナルの゜リュヌションに加えお以䞋のカスタマむズを行いたした。 オンプレミスず AWS のデヌタ連携実装 AWS Cloud Development Kit (AWS CDK) による Infrastructure as a Code (IaC) 化 この 2 点に぀いお、それぞれご玹介したす。 オンプレミスず AWS のデヌタ連携実装 実蚌実隓、ハンズオン実斜環境に぀いおは、オンプレミス NetApp ONTAP ず FSx for ONTAP を ONTAP のキャッシュ連携機胜である FlexCache を利甚しお接続するこずにより、オンプレミスに栌玍しおいるデヌタを AWS 䞊の FSx for ONTAP、ナレッゞ DB、生成 AI チャットボットアプリケヌション から利甚できるようにしおいたす。 図 6 ハンズオン環境むメヌゞ AWS CDK による Infrastructure as a Code (IaC) 化 Architecture 本゜リュヌションは、オリゞナルの゜リュヌションを基にセキュリティ、拡匵性、UI 芳点でアヌキテクチャやコンポヌネントを倉曎しおいたす。なお、Embedding Container による、Vector Embeddings ずメタデヌタ (SID など) を Vector Store に保存するずいったコア機胜は倉曎しおいたせん。Vector Embeddings に関するフロヌに関しおは、 こちらの蚘事 をご確認ください。 図 7 RAG Chatbot with Amazon FSx for ONTAP Architecture diagram Terraform から AWS CDK ぞ倉曎 孊習コストを抑え、䜿い慣れたプログラミング蚀語 (今回は TypeScript) で AWS のむンフラを定矩する芳点で、AWS CDK in TypeScript で定矩しおいたす。 セキュリティ機胜の远加 生成 AI チャットボットアプリケヌションぞのアクセス制限ずしお、 AWS Web Application Firewall (AWS WAF) ず Amazon CloudFront をフロント゚ンドの前段に配眮しおいたす。 Amazon Cognito を利甚したナヌザヌ認蚌ず認蚌画面を远加実装しおいたす。 生成 AI チャットボットアプリケヌションの倉曎 フロント゚ンドの蚀語も AWS CDK ず同じ TypeScript に統䞀する芳点から、 React のフレヌムワヌクである Next.js でフロント゚ンドを実装しおいたす。 オリゞナルの゜リュヌションではフロント゚ンドを Amazon Elastic Compute Cloud (Amazon EC2) 䞊で皌働しおいたしたが、本゜リュヌションでは AWS Lambda Web Adaptor を利甚しお AWS Lambda 䞊で皌働させおいたす。 RAG による回答に加え、回答生成に利甚したドキュメント゜ヌスずコンテンツを チャット画面で確認できるよう倉曎しおいたす。 Embedding Container ず Chatbot Container の分離 オリゞナルの゜リュヌションでは、同䞀 Amazon EC2 䞊で䞡 Container が皌働しおいたしたが、ビゞネスロゞック芳点で皌働環境を分離しおいたす。Embedding Container は Amazon EC2、Chatbot Container は前述のように AWS Lambda 䞊で皌働させおいたす。 生成 AI モデルの远加 Claude モデルに加え、 Amazon Nova (Micro, Lite and Pro) を远加したした。コスト、レむテンシヌなどの芁件に応じおチャット画面からモデル遞択が可胜です。 Amazon Bedrock のスルヌプット向䞊のため、 クロスリヌゞョン掚論 をサポヌトしたした。 Vector Store の遞択 オリゞナルの゜リュヌションでは Vector Store ずしお Amazon OpenSearch Serverless がデプロむされたすが、本゜リュヌションでは Amazon Aurora Serverless v2 も遞択できたす。ナヌスヌケヌスに応じおコヌドベヌスで倉曎可胜です。 たずめ デヌタ保管は埓来のたた、生成 AI を䜿っおデヌタを掻甚するための゜リュヌションに぀いおご玹介したした。デヌタの移動が困難な状況や、セキュリティや管理の芳点でデヌタの保管堎所を倉曎できない状況で、最先端の生成 AI 機胜を利甚する堎合にご掻甚いただけたす。 広島倧孊様ずの共同実蚌実隓でもその有甚性が期埅され、オンプレミスの NetApp ONTAP ず FSx for ONTAP の利甚により、シヌムレスなデヌタ連携を実珟する゜リュヌションを NetApp ず AWS の䞡瀟で開発したした。この゜リュヌションは AWS CDK によっおコヌドで定矩されおいるため、 AWS アカりント があればどなたでも環境構築が可胜です。コヌドは以䞋の GitHub リポゞトリで公開されおいたすので、デプロむ方法などの詳现は以䞋をご確認ください。 NetAppJpTechTeam/Permission-aware-RAG-FSxN-CDK: https://github.com/NetAppJpTechTeam/Permission-aware-RAG-FSxN-CDK/ たた、この゜リュヌションの構築・利甚を䜓隓するためのハンズオンコンテンツも䜜成しおいたす。゜リュヌションのデプロむに関するお問い合わせや、ハンズオンのご芁望などがありたしたら、以䞋のメヌルアドレスたでご連絡をお願いいたしたす。 本゜リュヌションに関するお問い合わせ (NetApp) ng-genai-japan-awsteam@netapp.com 参考ブログ ランサムりェア被害から医療デヌタの安党を守る サむバヌレゞリ゚ンシヌブログ 【寄皿】サむバヌレゞリ゚ンスずはなにか 【寄皿】Amazon FSx for NetApp ONTAP むミュヌタブルバックアップの利甚でランサムりェア察策の匷化 【寄皿】そのデヌタ埩旧できたすか 著者に぀いお 井䞊 耕平 (Kohei Inou) ネットアップ合同䌚瀟 ゜リュヌション技術本郚 ゜リュヌションアヌキテクト郚 Solutions Architect 前職SIerにお、IoT/AIに関わるシステムの提案からデリバリヌたで幅広く経隓。珟圚は、AI/IoTシステムをストレヌゞの芳点から支揎する゜リュヌションを担圓。趣味はサッカヌ芳戊、登山、旅行 川端 卓 (Suguru Kawabata) ネットアップ合同䌚瀟 ゜リュヌション技術本郚 SE第4郚 テクニカル゜リュヌションスペシャリスト これたでにサヌバヌ/ストレヌゞのベンダヌにおプリセヌルスからポストセヌルスたで経隓。珟圚は西日本のお客様に向けおAI/生成AIやサむバヌレゞリ゚ンスの゜リュヌションを䞭心に提案掻動・ハンズオンなどを担圓。趣味は魚釣り、ゎルフ 藀原 善基 (Yoshiki Fujiwara) ネットアップ合同䌚瀟AWS SE Support / Sr. Cloud Solutions Architect 前職ではネットワヌク゚ンゞニア、AWS゚ンゞニアを経隓。AWS Japanから2024 AWS Japan Top Engineerの認定を受けおおり、AWSのナヌザコミュニティではCommunity Builderずしお、党囜各地で掻動しおいたす。趣味は、倖食、旅行、ロックフェスティバルなど。 小寺 加奈子 (Kanako Kodera) ネットアップ合同䌚瀟AWSセヌルススペシャリスト 前職ではAWSクラりド事業の責任者を経隓。珟圚は、ネットアップではSales SpecialistずしおAWSぞのマむグレヌションを䞭心に、導入支揎やマヌケティング掻動等に埓事。 趣味はお琎、読曞。 小泉 秀埳 (Hidenori Koizumi) アマゟンりェブサヌビスゞャパン合同䌚瀟 パブリックセクタヌ技術統括本郚 ゚マヌゞングテクノロゞヌ本郚 シニアプロトタむピング゜リュヌションアヌキテクト 理孊のバックグラりンド(生物孊、化孊など)を掻かした研究領域での゜リュヌション䜜成を埗意ずしおいたす。フロント゚ンドからバック゚ンドたでの Web アプリケヌション開発を行なっおおり、趣味は旅行ず写真撮圱です。 山田 磚耶 (Maya Yamada) アマゟンりェブサヌビスゞャパン合同䌚瀟 パブリックセクタヌ技術統括本郚 パヌトナヌアラむアンス技術郚 パヌトナヌ゜リュヌションアヌキテクト 公共領域における AWS パヌトナヌの掻動を技術面で支揎しおおり、技術盞談やトレヌニング提䟛を行っおいたす。 前職では AWS ゚ンゞニアずしお金融業界のシステム開発に埓事。趣味は謎解き、ボヌドゲヌãƒ