TECH PLAY

データサイエンティストのための特徴量エンジニアリング

3,938円 (税込)

楽天

データサイエンティストのための特徴量エンジニアリング

書籍情報

発売日:

著者/編集:Soledad Galli/松田晃一

出版社:マイナビ出版

発行形態:単行本

書籍説明

内容紹介

データを機械学習モデルが理解できる形式に変換する重要プロセス「特徴量エンジニアリング」のための具体的な手順をPythonプログラミングを交えて解説。

目次

1章 欠損値を補完する 2章 カテゴリ変数をエンコーディングする 3章 数値変数を変換する 4章 変数を離散化する 5章 外れ値を扱う 6章 日付と時刻の変数から特徴量を抽出する 7章 特徴量をスケーリングする 8章 新しい特徴量を作成する 9章 Featuretoolsを用いてリレーショナルデータから特徴量を抽出する 10章 tsfreshを使って時系列データから特徴量を作成する 11章 テキスト変数から特徴量を抽出する 付録 日本語を扱う

著者情報

Galli, Soledad

Soledad Galli

Soledad Galli : 世界的な学術機関や有名な企業で10年以上の経験を持つデータサイエンティスト、インストラクター、ソフトウェア開発者。保険金請求や信用リスクの評価、詐欺の防止を目的とした機械学習モデルを開発し実運用に成功している。複数のオンラインコースで機械学習を教えており、オープンソースのPythonライブラリFeature-engineを開発・保守している。2018年にData Science Leaders Awardを受賞、2019年にデータサイエンスと分析におけるLinkedIn Voices (LinkedInインフルエンサー) の1人に認定されている。

松田, 晃一, 1960-

類似書籍