データサイエンス入門

書籍情報

発売日 : 2021年04月13日

著者/編集 : 笹嶋 宗彦

出版社 : 朝倉書店

発行形態 : 全集・双書

書籍説明

内容紹介

データサイエンティストに求められるデータの見方の基礎を実際のデータを見ながら身につける。

目次

1. データを見てみよう
 1.1 学びの場と実践の現場の違い
 1.2 あるデータ分析の流れ

2. データを要約すると何が見えてくる?
 2.1 データを代表する値
  2.1.1 平均
  2.1.2 中央値
  2.1.3 最頻値
  2.1.4 外れ値
  2.1.5 平均からいえること,言えないこと
 2.2 データのばらつきを表す尺度
  2.2.1 分散
  2.2.2 標準偏差
 2.3 四分位数と箱ひげ図
  2.3.1 四分位数
  2.3.2 箱ひげ図
 2.4 まとめ

3. 関係性を調べる
 3.1 データの相対的な関係
  3.1.1 変動係数
  3.1.2 Zスコア
  3.1.3 偏差値
 3.2 相関
  3.2.1 牛肉をよく買う地域では豚肉や鶏肉もよく買われるのか?
  3.2.2 相関係数と共分散
  3.2.3 相関関係と因果関係
  3.2.4 データがグループに分かれる場合
  3.2.5 直線的ではないような相関関係
  3.2.6 散布図行列

4. より高度な分析1:日本人の米離れは本当か?
 4.1 オープンデータを使ってみよう
 4.2 米の消費支出は減少しているの?
 4.3 来年はどうなるの?
  4.3.1 移動平均法を用いた傾向の可視化
  4.3.2 指数平滑法を用いた予測モデルの構築
 4.4 まとめ

5. より高度な分析2:気温から売り上げを予測する
 5.1 線形単回帰の概要
 5.2 線形単回帰の数学的説明
 5.3 線形回帰による気温からの売り上げ予測
 5.4 Pythonによる回帰

6. より高度な分析3:食べ物の好みで都道府県を分類する
  6.1 クラスタリングとは
  6.2 k-means
   6.2.1 k-meansの概要
   6.2.2 k-meansによるクラスタリングと結果の分析
   6.2.3 パラメータの決め方
  6.3 階層的クラスタリング
  6.4 Pythonによるクラスタリング

7. 企業の応用ケース
 7.1 あなたの好みの寿司ネタは?(スシロー:地域別に有効なキャンペーンの分析)
  7.1.1 スシローの紹介
  7.1.2 スシローを支えるITシステム
  7.1.3 スシローのすしランキング
  7.1.4 スシローの経営へのフィードバック
 7.2 サテライトオフィスの立地戦略(ザイマックスグループ)
  7.2.1 ZXYワーク事業の概要
  7.2.2 ZXYワークにおけるデータ分析
  7.2.3 新規拠点開設の検討に活かされるデータ分析1:公的統計データを用いたデモグラフィック分析
  7.2.3 新規拠点開設の検討に活かされるデータ分析2:既存拠点の混雑緩和を目的とした新規開設立地の評価
  7.2.5 企業の意思決定のためにデータを分析し視覚化する意義

A. 本書のプログラムを実行する環境の構築
 A.1 Anacondaによる環境構築

著者情報

笹島, 宗彦, 1969-
笹嶋 宗彦
兵庫県大
加藤, 直樹, 1951-