Hadoop

イベント

注目のイベント

Hadoopに関するイベントが見つかりませんでした。

マガジン

技術ブログ

AWS Glue Data Catalog のテーブル統計自動収集機能の紹介 – Amazon Redshift と Amazon Athena のクエリパフォーマンス向上

本記事は 2024 年 12 月 3 日 に公開された「 Introducing AWS Glue Data Catalog automation for table statistics collection for improved query performance on Amazon Redshift and Amazon Athena 」を翻訳したものです。 AWS Glue Data Catalog で、新しいテーブルの統計情報を自動的に生成できるようになりました。これらの統計情報は Amazon Redshift Spectrum と Amazon Athena のコストベースオ

S3+Parquet(Hive 形式)vs S3 Tablesでクエリ速度がどうなるか4.32億レコードで検証!

はじめに こんにちは! Amazon S3 Tables を利用して、データレイクを構築する機会がありました。 最初は、「S3 + Parquet(Hive 形式)」を検討していましたが、特定のレコードを上書きしたいと思った時に、うまく実装することができませんでした。 S3 Tables を利用すると、特定のデータの更新・削除が可能であることから、S3 Tables を採用することにしました。 S3 Tables(Iceberg

AWS DMS によるリアルタイムでの Iceberg の取り込み

本投稿は、 Caius Brindescu と Mahesh Kansara による記事 「 Real-time Iceberg ingestion with AWS DMS 」を翻訳したものです。 これは、AWS とのパートナーシップに基づいた、Etleap の主任エンジニアである Caius Brindescu によるゲスト投稿です。 タイムリーな意思決定には、低レイテンシーで最新のデータにアクセスすることが不可欠です。しかし、多くのチームにとって、データレイクへの

動画

書籍