TECH PLAY

[エンジニアのための]データ分析基盤入門<実践編> 主要プロダクトに共通する理論×技術 クラウド&オンプレ対応

3,630円 (税込)

Amazon楽天

[エンジニアのための]データ分析基盤入門<実践編> 主要プロダクトに共通する理論×技術 クラウド&オンプレ対応

書籍情報

発売日:

著者/編集:斎藤 友樹

出版社:技術評論社

発行形態:単行本

書籍説明

内容紹介

より多くのビジネス成果を生み出すデータ分析基盤(データ基盤)の構築・運用をテーマとした技術解説書。『[エンジニアのための]データ分析基盤入門<基本編>』の続編として、現場で求められる設計判断や運用視点を整理しました。 現実のデータ分析基盤には、技術・組織・コスト・安全性・拡張性など、多様なコンテキストが複雑に絡み合います。本書では、基本事項や手順と合わせて、SLO設計、データ加工戦略、フェデレーション環境におけるネットワーク負荷など、具体的な観点を織り込みました。 「何の技術を採用するか」以上に、重要なのは「どの課題を、どんな視点で捉えるか」。本書は、無数に答えがあるデータエンジニアリングの現場において、課題構造を理解し、状況に応じて最適な選択を行い続けるための考え方を押さえます。また、ローカル環境およびクラウド環境で動作する学習用データ分析基盤の構築例を提供し、本を読むだけでも、実機で試しながらでも学べる構成です。 データ基盤は、作るよりも「続ける」なかで真価が問われると言われます。広くデータ基盤に携わる方々に向けて、変化し続けるプラットフォームと向き合うためのデータエンジニアリングの思考と技術力が身につく1冊です。 第1章 データ分析基盤への招待 データ分析基盤の大枠を知ろう 第2章 ローカル端末で学ぶデータ分析基盤 ローカルのデータ分析基盤を利用して理解を促進しよう 第3章 バッチデータパイプライン バッチ処理の基本と実践 第4章 ストリーミングデータパイプライン バッチの知識をもとにストリーミング固有の問題に対処しよう 第5章 データパイプラインとアドオン機能 多機能なパイプラインを実装しよう 第6章 データパイプラインとデータ品質管理 データとデータ品質を相互運用しよう 第7章 データパイプラインとメタデータ管理 データとメタデータを相互運用しよう 第8章 データ分析基盤と開発プロセス 環境を整えて活動のスピードを上げよう 第9章 データマネジメントとドキュメンテーション データ分析基盤の秩序と活動方針を言語化しよう 第10章 データ分析基盤とパブリッククラウド クラウドでデータ分析基盤をシンプルにすばやく構築する 第11章 シンプル構成で始めるクラウド分析基盤 最小限の構成で体験するクラウド分析基盤 第12章 データ分析基盤と機械学習(ML)モデル データをもとにモデルを作成する活動についても知ろう

著者情報

斎藤 友樹