Amazon Web Services ブログ

AWS Pi Day 2025: 分析と AI のためのデータ基盤

毎年 3 月 14 日 (3.14) に開催される AWS Pi Day では、データの管理と利用に役立つ AWS のイノベーションを重点的に取り上げます。2021 年に Amazon Simple Storage Service (Amazon S3) のリリース 15 周年を記念して始まったこのイベントは、現在ではクラウドテクノロジーがデータ管理、分析、AI をどのように変革しているのかに重点を置くイベントに成長しました。

2025 年の AWS Pi Day は、AWS 上の統合データ基盤を使用した分析と AI のイノベーションの加速に焦点を当てて開催されます。ほとんどのエンタープライズ戦略で AI が登場し、分析と AI のワークロードがますます相互に関連し、多くの同じデータとワークフローを使用するようになる中で、データ環境は大きな変革を遂げています。すべてのデータにアクセスし、単一の統合エクスペリエンスですべてのお好みの分析および AI ツールを使用するための簡単な方法が求められています。2025 年の AWS Pi Day では、統合データエクスペリエンスの構築に役立つ一連の新機能をご紹介します。

次世代の Amazon SageMaker: すべてのデータ、分析、AI の中心
re:Invent 2024 では、すべてのデータ、分析、AI の中心となる次世代の Amazon SageMaker を発表しましたSageMaker には、データの探索、準備、統合、ビッグデータ処理、高速 SQL 分析、機械学習 (ML) モデルの開発とトレーニング、生成 AI アプリケーション開発に必要なほぼすべてのコンポーネントが含まれています。この新世代の Amazon SageMaker では、SageMaker Lakehouse がデータへの統合アクセスを提供し、SageMaker Catalog がガバナンスとセキュリティの要件を満たすのをサポートします。詳細については、同僚の Antje が書いたリリースに関するブログ記事をお読みください。

次世代の Amazon SageMaker の中核となるのは、SageMaker Unified Studio です。これは、分析と AI のためにすべてのデータとツールを使用できる単一のデータおよび AI 開発環境です。SageMaker Unified Studio の一般提供が開始されました

SageMaker Unified Studio は、データ、分析、AI ワークフロー、およびアプリケーションに取り組むデータサイエンティスト、アナリスト、エンジニア、およびデベロッパー間のコラボレーションを容易にします。データ処理、SQL 分析、ML モデル開発、生成 AI アプリケーション開発など、AWS の分析および人工知能と機械学習 (AI/ML) サービスの使い慣れたツールを単一のユーザーエクスペリエンスで使用できるようにします。

SageMaker Unified Studio

また、SageMaker Unified Studio は、Amazon Bedrock からの特定の機能を SageMaker で使用できるようにします。。基盤モデル (FM) と、Amazon Bedrock のナレッジベースAmazon Bedrock ガードレールAmazon Bedrock エージェントAmazon Bedrock Flows などの高度な機能を使用して、迅速に生成 AI アプリケーションのプロトタイプを作成したり、生成 AI アプリケーションをカスタマイズおよび共有したりして、お客様の要件と、責任ある AI ガイドラインに整合する、カスタマイズされたソリューションを、すべて SageMaker 内で作成できるようになりました。

最後に、Amazon Q Developer一般提供が SageMaker Unified Studio で開始されました。Amazon Q Developer は、データと AI 開発のために、生成 AI を活用したサポートを提供します。SQL クエリの記述、抽出、変換、ロード (ETL) ジョブの構築、トラブルシューティングなどのタスクでお客様をサポートし、既存のサブスクライバーは無料の階層と Pro の階層で利用できます。

同僚の Donnie が最近書いたブログ記事で、SageMaker Unified Studio の詳細をご覧いただけます。

re:Invent 2024 では、次世代の SageMaker の一部として Amazon SageMaker Lakehouse もリリースしました。SageMaker Lakehouse は、Amazon S3 データレイク、Amazon Redshift データウェアハウス、サードパーティーおよびフェデレーテッドデータソース全体ですべてのデータを統合します。データの単一コピーを使用して強力な分析および AI/ML アプリケーションを構築するのに役立ちます。SageMaker Lakehouse は、Apache Iceberg 互換のツールとエンジンを使用して、データにインプレースでアクセスしてクエリを実行する柔軟性を提供します。さらに、ゼロ ETL 統合により、Amazon Aurora および Amazon DynamoDB などの AWS データソースや、SalesforceFacebook AdsInstagram AdsServiceNowSAPZendeskZoho CRM などのアプリケーションから SageMaker Lakehouse にデータを取り込むプロセスが自動化されます。統合の詳細なリストは、「SageMaker Lakehouse に関するよくある質問」でご覧いただけます

Amazon S3 を利用したデータ基盤の構築
データ基盤の構築は、分析と AI ワークロードを加速するための基礎であり、組織があらゆる規模でデータアセットをシームレスに管理、検出、活用できるようにします。Amazon S3 は、事実上無制限の規模でデータレイクを構築するのに最適な場所であり、この変革に不可欠な基盤を提供します。

私は Amazon S3 の運用規模を知るたびに驚かされます。現在、Amazon S3 は 400 兆を超えるオブジェクト、エクサバイト規模のデータを保持しており、1 秒あたり 1 億 5,000 万件という驚異的な数のリクエストを処理しています。わずか 10 年前は、S3 に 1 ペタバイト (PB) を超えるデータを保存しているお客様の数は 100 にも届いていませんでした。今日では、何千ものお客様が 1 PB のマイルストーンを超えています。

Amazon S3 はエクサバイト規模の表形式データを保存し、1 秒あたり平均 1,500 万件を超える、表形式データに対するリクエストを処理しています。S3 バケットで表形式データを管理する際の、付加価値を生まない手間のかかる作業を軽減するのに役立つよう、当社は AWS re:Invent 2024 で Amazon S3 Tables を発表しました。S3 Tables は、Apache Iceberg のサポートが組み込まれた初のクラウドオブジェクトストアです。S3 テーブルは分析ワークロード向けに特別に最適化されており、セルフマネージドテーブルと比較して、クエリスループットが最大 3 倍高速になり、1 秒あたりのトランザクション数が最大 10 倍になります。

3 月 14 日、弊社は、Amazon S3 Tables Amazon SageMaker Lakehouse の統合の一般提供の開始を発表しました。Amazon S3 Tables が Amazon SageMaker Lakehouse と統合するようになったため、Amazon Redshift、Amazon AthenaAmazon EMRAWS Glue などの AWS の分析サービスや、Apache Spark や PyIceberg などの Apache Iceberg 互換エンジンから S3 Tables に簡単にアクセスできるようになりました。SageMaker Lakehouse を利用すると、S3 Tables や他のソースについてのきめ細かなデータアクセス許可を一元的に管理し、すべてのエンジンで一貫して適用できます。

サードパーティーのカタログを使用しているお客様、カスタムカタログ実装があるお客様、または単一のテーブルバケット内の表形式データに対する基本的な読み取りおよび書き込みアクセスのみを必要とするお客様のために、当社は、Iceberg REST Catalog 標準と互換性のある新しい API を追加しました。これにより、Iceberg 互換のアプリケーションは、S3 テーブルバケット内のテーブルをシームレスに作成、更新、一覧表示、削除できます。すべての表形式データ、データガバナンス、およびきめ細かなアクセスコントロールにわたる統合データ管理のために、SageMaker Lakehouse で S3 Tables を使用することもできます。

S3 Tables にアクセスしやすくするために、AWS マネジメントコンソールで更新の提供を開始しました。Amazon Athena を利用して、テーブルを作成し、データを入力して、S3 コンソールから直接クエリを実行できるようになりました。これにより、使用を開始して、S3 テーブルバケット内のデータを分析するのがより簡単になりました。

次のスクリーンショットは、S3 コンソールから直接 Athena にアクセスする方法を示しています。

S3 コンソール: Athena を利用してテーブルを作成[Athena を利用してテーブルをクエリ] または [Athena を利用してテーブルを作成] を選択すると、適切なデータソース、カタログ、データベースで Athena コンソールが開きます。

Athena の S3 Tables

re:Invent 2024 以降、当社は速いペースで S3 Tables に新しい機能を追加し続けています。例えば、CreateTable API にスキーマ定義のサポートを追加しました。これにより、S3 テーブルバケットに最大 10,000 個のテーブルを作成できるようになりました。また、S3 Tables は 8 つの追加の AWS リージョンでもリリースされました。最新のリリースは 3 月 4 日のアジアパシフィック (ソウル、シンガポール、シドニー) であり、今後も他のリージョンでリリースされる予定です。現在 S3 Tables が利用可能な 11 のリージョンのリストについては、ドキュメントの S3 Tables の AWS リージョンのページをご覧ください。

Amazon S3 Metadata (re:Invent 2024 で発表) は、1 月 27 日から一般提供が開始されています。これは、ほぼリアルタイムで更新される、自動化された簡単にクエリできるメタデータを使用して、S3 データを検出して理解するのに役立つ極めて迅速かつ簡単な方法です。S3 Metadata は S3 オブジェクトタグと連携して機能します。タグは、IAM ポリシーを適用してきめ細かなアクセスを提供したり、タグベースのフィルターを指定してオブジェクトのライフサイクルルールを管理したり、データを別のリージョンに選択的にレプリケートしたりするなど、さまざまな理由でデータを論理的にグループ化するのに役立ちます。S3 Metadata が利用可能なリージョンでは、オブジェクトタグとして保存されているカスタムメタデータをキャプチャしてクエリできます。S3 Metadata を使用する際にオブジェクトタグに関連して発生するコストを削減するために、Amazon S3 は、すべてのリージョンで S3 オブジェクトタグ付けの料金を 35% 引き下げました。これにより、カスタムメタデータの使用コストが削減されます。

AWS Pi Day 2025
長年にわたって、AWS Pi Day では、クラウドストレージとデータ分析における主要なマイルストーンをご紹介してきました。2025 年の AWS Pi Day 仮想イベントでは、デベロッパーや技術的な領域における意思決定者、データエンジニア、AI/ML 実践者、IT リーダー向けに設計されたさまざまなトピックを取り上げます。主なハイライトには、この記事で説明したすべてのサービスと機能に関する詳細な説明、ライブデモ、エキスパートによるセッションが含まれます。

このイベントに参加することで、分析と AI のイノベーションを加速する方法を学ぶことができます。ネイティブの Apache Iceberg サポートおよび S3 Metadata とともに S3 Tables を使用して、従来の分析と新しい AI/ML ワークロードの両方に対応するスケーラブルなデータレイクを構築する方法を学びます。また、すべてのデータ、分析、AI の中心となる次世代の Amazon SageMaker についても学びます。これは、データレイク、データウェアハウス、サードパーティーまたはフェデレーテッドデータソースに保存されているすべてのデータにアクセスできる使い慣れた AWS ツールを使用して、チームが統合スタジオからコラボレーションし、より迅速に構築するのに役立ちます。

クラウドに関する最新のトレンドを先取りしたいお客様にとって、AWS Pi Day 2025 は見逃せないイベントです。データレイクハウスの構築、AI モデルのトレーニング、生成 AI アプリケーションの構築、分析ワークロードの最適化など、進めている取り組みがどのようなものであっても、共有されたインサイトはデータの価値を最大化するのに役立ちます。

今すぐ視聴して、クラウドデータイノベーションに関する最新情報をご覧ください。データ、分析、AI の未来を形作る AWS のエキスパート、パートナー、お客様とつながる機会をお見逃しなく。

3 月 14 日のバーチャルイベントを見逃したお客様もご安心ください。いつでもイベントページにアクセスして、すべてのコンテンツをオンデマンドでご視聴いただけます!

– seb


ニュースブログはいかがでしたか? こちらの 1 分間のアンケートにぜひご協力ください!

(このアンケートは外部企業に委託して行われます。AWS は、AWS プライバシー通知に記載されているとおりにお客様の情報を取り扱います。AWS は、このアンケートを通じて収集したデータを所有し、収集した情報をアンケートの回答者と共有することはありません)

原文はこちらです。