はじめてのAIリテラシー
書籍情報
発売日 : 2021年06月24日
著者/編集 : 岡嶋裕史・吉田雅裕
出版社 : 技術評論社
発行形態 : 単行本
書籍説明
内容紹介
初級レベルの数理・データサイエンス・AIの学習ができる。モデルカリキュラムの基礎的な範囲に対応し、文系でも無理なく学べる。文科省の認定制度に準拠した14講義を収録。
目次
■第1講 AIリテラシーとは
◆1-1 AIの定義
●AIとは
●強いAIと弱いAI
●人間らしさとAI(チューリングテスト)
●中国語の部屋
●チャットボット
●ELIZA効果
◆1-2 なぜAIが必要とされているのか
●AIへの期待
●ハイプ曲線
●AIブーム
◆1-3 この本ではどこまで学ぶか
●AIのしくみや原理
●AIの発展と人間の自由
コラム 数理・データサイエンス・AI教育プログラム認定制度について
■第2講 社会でどのような変化が起きているか
◆2-1 ビッグデータ、IoT、5Gなどの登場
●ビッグデータとは
●ビッグデータの定義
●オープンデータの活動
●IoTとビッグデータ
●5GはIoTを促進
◆2-2 第4次産業革命、Society5.0
●進化するテクノロジーと社会
●第4次産業革命のテクノロジー
●新しい社会Society5.0
◆2-3 データ駆動型社会
●データ革命による他分野への応用
●データ駆動型社会とは
●データの扱い方が重要
■第3講 社会でどのようなデータが活用されているか
◆3-1 人の動線をめぐるデータ
●注目される私的データ
●カーナビの例
●監視カメラの例
◆3-2 多くの機器のログとオープンデータ
●SNSのデータ分析
●オープンデータの活用
●ログによるアクセスデータ
◆3-3 1次データ、2次データ、メタデータ
●1次データと2次データ
●メタデータ
◆3-4 非構造化データの増大
●データベースとデータの構造化
●非構造化データの活用
■第4講 データ・AIを何に使えるか
◆4-1 データ・AIの活用領域の広がり
●身近になっていくデータサイエンス
●多様化するデータの活用例
●日本でのデータ利活用
●匿名加工情報
◆4-2 具体的にどう使えばいいのか
●データの使い方・仮説検証型
●データの使い方・仮説探索型
●人の負担を軽減するエスカレーション
●AIが得意な仕事、苦手な仕事
●意思決定支援システム
●AIの意外な使い方
◆4-3 シェアリングエコノミー、エビデンスベース社会、ナッジ
●シェアリングエコノミーとは
●データとAIの活用で上手にマッチング
●ネットの信頼性とリスク
●エビデンスベース社会とは
■第5講 データ・AIの技術
◆5-1 データ解析とは何をしているのか
●昔から解析は行われていた
●AIによるデータ解析の特徴
◆5-2 可視化の手法にはどういったものがあるのか
●グラフによる可視化
●地図を使った可視化
●動的な可視化
◆5-3 非構造化データの処理とは
●言語処理
●画像処理
●音声処理
◆5-4 AIの技術とは
●コンピュータ自ら学習する機械学習
●教師あり学習、教師なし学習
●強化学習
●深層学習(ディープラーニング)
●転移学習
■第6講 データを読み、説明し、扱う
◆6-1データの種類を知る
●データの種類を知って正しく使う
●連続データと離散データ
●質的データと量的データ
コラム データを扱うときの注意点
◆6-2 基本統計量でデータの特徴をつかむ
●基本統計量とは
●データの真ん中を表す指標
●データの散らばり具合を見る
◆6-3 もととなるデータを集める
●母集団と標本
●標本誤差
●無作為抽出
◆6-4 集めたデータを集計する
●クロス集計
●相関関係と因果関係
●地図上の可視化
◆6-5 誤読しないデータの読み方、データの比較方法
●騙されやすいグラフの例
コラム 新技術との付き合い方について
■第7講 データ・AIを扱うときに注意すること
◆7-1 データ活用の負の側面
●かゆいところに手が届くビッグデータの活用
●自分のデータが勝手に記録され、保存される
◆7-2 GDPR、忘れられる権利、ELSI、オプトイン・オプトアウト
●EUの取り組み
●GDPRの定める権利
●ELSIとSTEM
●トロッコ問題
●オプトイン・オプトアウト
◆7-3 データの正義について
●機械がやるから公平か?
●AIの判断は正しい?
●道路標識を誤認させる攻撃
●人間中心のAI社会原則
■第8講 データ・AIにまつわるセキュリティ
◆8-1 情報セキュリティの基礎
●セキュリティとは
●セキュリティでは「リスク」に注目
●経営資源(情報資産)、脅威、脆弱性
●リスクの顕在化
●セキュリティ対策の手順と受容水準
●リスクへの対応方法
◆8-2 情報のCIA
●機密性、完全性、可用性
●多要素認証
◆8-3 暗号化と匿名加工情報
●暗号化とは
●個人情報の保護と匿名加工情報
■第9講 統計と数学のきほん
◆9-1 AIに必要な数学
●AIの理解には数学が必要
●誕生日のパラドックス
●クーポン収集問題
●数え上げ
◆9-2 AIに必要な集合・場合の数
●「集合」と「場合の数」
●和の法則
●積の法則
◆9-3 AIに必要な確率・統計
●確率
●確率分布
●推測統計
コラム ナイチンゲールとデータサイエンス
■第10講 アルゴリズムとは何か
◆10-1 AIとアルゴリズム
●アルゴリズムとは
●ハードウェアとソフトウェア
●ソフトウェアの性能を上げる
●アルゴリズム工学
◆10-2 組み合せ爆発を攻略するAIのアルゴリズム
●組み合せ爆発とは
●ボードゲームに挑むAI
●総当たりアルゴリズム
●近似アルゴリズム
●確率的アルゴリズム
◆10-3 探索問題
●探索問題とは
●線形探索
●二分探索
◆10-4 二部マッチング問題
●二部マッチング問題とは
●局所最適
●全体最適
■第11講 データの構造とプログラミング
◆11-1 ソフトウェアのプログラミング
●プログラミングスキルを身につけよう
●プログラミングとは
◆11-2 プログラミングの歴史
●世界初のコンピュータENIAC
◆11-3 データの構造
●10進数と2進数
●ビットとバイト
●文字コード
◆11-4 プログラミング環境の構築
●Pythonの導入
●Colaboratoryの使い方
◆11-5 変数
●変数と変数名
●変数に値を代入
●変数の内容を更新
◆11-6 条件分岐
●条件分岐とは
●If文
●PythonでIf文のプログラミング
◆11-7 繰り返し
●ループ処理
●for文
●Pythonでfor文のプログラミング
■第12講 データを上手に扱うには
◆12-1 ビッグデータの収集
●データは21世紀の石油
●多種大量のビッグデータ
◆12-2 データベース
●データベースとは
●RDBと正規化
◆12-3 データ加工
●データ結合
●Pythonで分析-データの準備
●Pythonで分析-読み込み
●Pythonで分析-結合
◆12-4 データクレンジング
●データクレンジングとは
●Pythonでデータクレンジング
●データの読み込み
●データを補完
●表記揺れの修正
●欠損値の変更
■第13講 時系列データと文章データの分析
◆13-1 時系列データ分析
●時系列データ分析とは
●時系列データと点過程データの違い
●目的変数を説明変数
◆13-2 時系列データの変動要因
●傾向変動
●循環変動
●季節変動
●不規則変動
◆13-3 時系列データ分析演習(二酸化炭素排出量の予測)
●Prophetのインストール
●時系列データの読み込み
●時系列データの可視化
●時系列データの事前処理
●時系列データの将来予測
◆13-4 文章データ分析
●文章データとは
●分かち書き(トークン化)
●形態素解析
●N-gram解析
◆13-5 文章データ分析演習(スパムメールフィルタの作成)
●データセットの読み込み
●ワードクラウドの作成
●ストップワードの除去
●形態素解析の実行
●スパムを分類するAIの作成
■第14講 データ活用実践(教師あり学習と教師なし学習)
◆14-1 AIの学習方式
●機械学習とAI
●教師あり学習
●教師なし学習
●強化学習
◆14-2 教師あり学習の出力
●分類
●回帰
◆14-3 教示なし学習の出力
●クラスタリング
●連関分析
◆14-4 過学習と汎化
●過学習
●汎化
◆14-5 データ活用実践1-教師あり学習、分類
●データセットの入手
●データセットの読み込み
●事前準備
●ランダムフォレストによる教師あり学習
●プログラムの実行
◆14-6 データ活用実践2-教師あり学習、回帰
●データセットの入手
●データセットの読み込み
●事前準備
●単回帰分析による教師あり学習
●グラフによる可視化
●決定係数
◆14-7 データ活用実践3-教師なし学習、連関分析
●データセットの入手と読み込み
●データ形式の変形
●ライブラリのインストール
●頻出商品の抽出
●連関分析の実行
◆1-1 AIの定義
●AIとは
●強いAIと弱いAI
●人間らしさとAI(チューリングテスト)
●中国語の部屋
●チャットボット
●ELIZA効果
◆1-2 なぜAIが必要とされているのか
●AIへの期待
●ハイプ曲線
●AIブーム
◆1-3 この本ではどこまで学ぶか
●AIのしくみや原理
●AIの発展と人間の自由
コラム 数理・データサイエンス・AI教育プログラム認定制度について
■第2講 社会でどのような変化が起きているか
◆2-1 ビッグデータ、IoT、5Gなどの登場
●ビッグデータとは
●ビッグデータの定義
●オープンデータの活動
●IoTとビッグデータ
●5GはIoTを促進
◆2-2 第4次産業革命、Society5.0
●進化するテクノロジーと社会
●第4次産業革命のテクノロジー
●新しい社会Society5.0
◆2-3 データ駆動型社会
●データ革命による他分野への応用
●データ駆動型社会とは
●データの扱い方が重要
■第3講 社会でどのようなデータが活用されているか
◆3-1 人の動線をめぐるデータ
●注目される私的データ
●カーナビの例
●監視カメラの例
◆3-2 多くの機器のログとオープンデータ
●SNSのデータ分析
●オープンデータの活用
●ログによるアクセスデータ
◆3-3 1次データ、2次データ、メタデータ
●1次データと2次データ
●メタデータ
◆3-4 非構造化データの増大
●データベースとデータの構造化
●非構造化データの活用
■第4講 データ・AIを何に使えるか
◆4-1 データ・AIの活用領域の広がり
●身近になっていくデータサイエンス
●多様化するデータの活用例
●日本でのデータ利活用
●匿名加工情報
◆4-2 具体的にどう使えばいいのか
●データの使い方・仮説検証型
●データの使い方・仮説探索型
●人の負担を軽減するエスカレーション
●AIが得意な仕事、苦手な仕事
●意思決定支援システム
●AIの意外な使い方
◆4-3 シェアリングエコノミー、エビデンスベース社会、ナッジ
●シェアリングエコノミーとは
●データとAIの活用で上手にマッチング
●ネットの信頼性とリスク
●エビデンスベース社会とは
■第5講 データ・AIの技術
◆5-1 データ解析とは何をしているのか
●昔から解析は行われていた
●AIによるデータ解析の特徴
◆5-2 可視化の手法にはどういったものがあるのか
●グラフによる可視化
●地図を使った可視化
●動的な可視化
◆5-3 非構造化データの処理とは
●言語処理
●画像処理
●音声処理
◆5-4 AIの技術とは
●コンピュータ自ら学習する機械学習
●教師あり学習、教師なし学習
●強化学習
●深層学習(ディープラーニング)
●転移学習
■第6講 データを読み、説明し、扱う
◆6-1データの種類を知る
●データの種類を知って正しく使う
●連続データと離散データ
●質的データと量的データ
コラム データを扱うときの注意点
◆6-2 基本統計量でデータの特徴をつかむ
●基本統計量とは
●データの真ん中を表す指標
●データの散らばり具合を見る
◆6-3 もととなるデータを集める
●母集団と標本
●標本誤差
●無作為抽出
◆6-4 集めたデータを集計する
●クロス集計
●相関関係と因果関係
●地図上の可視化
◆6-5 誤読しないデータの読み方、データの比較方法
●騙されやすいグラフの例
コラム 新技術との付き合い方について
■第7講 データ・AIを扱うときに注意すること
◆7-1 データ活用の負の側面
●かゆいところに手が届くビッグデータの活用
●自分のデータが勝手に記録され、保存される
◆7-2 GDPR、忘れられる権利、ELSI、オプトイン・オプトアウト
●EUの取り組み
●GDPRの定める権利
●ELSIとSTEM
●トロッコ問題
●オプトイン・オプトアウト
◆7-3 データの正義について
●機械がやるから公平か?
●AIの判断は正しい?
●道路標識を誤認させる攻撃
●人間中心のAI社会原則
■第8講 データ・AIにまつわるセキュリティ
◆8-1 情報セキュリティの基礎
●セキュリティとは
●セキュリティでは「リスク」に注目
●経営資源(情報資産)、脅威、脆弱性
●リスクの顕在化
●セキュリティ対策の手順と受容水準
●リスクへの対応方法
◆8-2 情報のCIA
●機密性、完全性、可用性
●多要素認証
◆8-3 暗号化と匿名加工情報
●暗号化とは
●個人情報の保護と匿名加工情報
■第9講 統計と数学のきほん
◆9-1 AIに必要な数学
●AIの理解には数学が必要
●誕生日のパラドックス
●クーポン収集問題
●数え上げ
◆9-2 AIに必要な集合・場合の数
●「集合」と「場合の数」
●和の法則
●積の法則
◆9-3 AIに必要な確率・統計
●確率
●確率分布
●推測統計
コラム ナイチンゲールとデータサイエンス
■第10講 アルゴリズムとは何か
◆10-1 AIとアルゴリズム
●アルゴリズムとは
●ハードウェアとソフトウェア
●ソフトウェアの性能を上げる
●アルゴリズム工学
◆10-2 組み合せ爆発を攻略するAIのアルゴリズム
●組み合せ爆発とは
●ボードゲームに挑むAI
●総当たりアルゴリズム
●近似アルゴリズム
●確率的アルゴリズム
◆10-3 探索問題
●探索問題とは
●線形探索
●二分探索
◆10-4 二部マッチング問題
●二部マッチング問題とは
●局所最適
●全体最適
■第11講 データの構造とプログラミング
◆11-1 ソフトウェアのプログラミング
●プログラミングスキルを身につけよう
●プログラミングとは
◆11-2 プログラミングの歴史
●世界初のコンピュータENIAC
◆11-3 データの構造
●10進数と2進数
●ビットとバイト
●文字コード
◆11-4 プログラミング環境の構築
●Pythonの導入
●Colaboratoryの使い方
◆11-5 変数
●変数と変数名
●変数に値を代入
●変数の内容を更新
◆11-6 条件分岐
●条件分岐とは
●If文
●PythonでIf文のプログラミング
◆11-7 繰り返し
●ループ処理
●for文
●Pythonでfor文のプログラミング
■第12講 データを上手に扱うには
◆12-1 ビッグデータの収集
●データは21世紀の石油
●多種大量のビッグデータ
◆12-2 データベース
●データベースとは
●RDBと正規化
◆12-3 データ加工
●データ結合
●Pythonで分析-データの準備
●Pythonで分析-読み込み
●Pythonで分析-結合
◆12-4 データクレンジング
●データクレンジングとは
●Pythonでデータクレンジング
●データの読み込み
●データを補完
●表記揺れの修正
●欠損値の変更
■第13講 時系列データと文章データの分析
◆13-1 時系列データ分析
●時系列データ分析とは
●時系列データと点過程データの違い
●目的変数を説明変数
◆13-2 時系列データの変動要因
●傾向変動
●循環変動
●季節変動
●不規則変動
◆13-3 時系列データ分析演習(二酸化炭素排出量の予測)
●Prophetのインストール
●時系列データの読み込み
●時系列データの可視化
●時系列データの事前処理
●時系列データの将来予測
◆13-4 文章データ分析
●文章データとは
●分かち書き(トークン化)
●形態素解析
●N-gram解析
◆13-5 文章データ分析演習(スパムメールフィルタの作成)
●データセットの読み込み
●ワードクラウドの作成
●ストップワードの除去
●形態素解析の実行
●スパムを分類するAIの作成
■第14講 データ活用実践(教師あり学習と教師なし学習)
◆14-1 AIの学習方式
●機械学習とAI
●教師あり学習
●教師なし学習
●強化学習
◆14-2 教師あり学習の出力
●分類
●回帰
◆14-3 教示なし学習の出力
●クラスタリング
●連関分析
◆14-4 過学習と汎化
●過学習
●汎化
◆14-5 データ活用実践1-教師あり学習、分類
●データセットの入手
●データセットの読み込み
●事前準備
●ランダムフォレストによる教師あり学習
●プログラムの実行
◆14-6 データ活用実践2-教師あり学習、回帰
●データセットの入手
●データセットの読み込み
●事前準備
●単回帰分析による教師あり学習
●グラフによる可視化
●決定係数
◆14-7 データ活用実践3-教師なし学習、連関分析
●データセットの入手と読み込み
●データ形式の変形
●ライブラリのインストール
●頻出商品の抽出
●連関分析の実行
著者情報
岡嶋, 裕史, 1972-
岡嶋裕史・吉田雅裕
●岡嶋 裕史(おかじま ゆうし)
1972年東京都生まれ。中央大学大学院総合政策研究科博士後期課程修了。博士(総合政策)。富士総合研究所、関東学院大学経済学部准教授、同大学情報科学センター所長を経て、現在、中央大学国際情報学部教授。NHKスマホ講座講師。著書に『ブロックチェーン』、『5G』(講談社ブルーバックス)、『実験でわかるインターネット』(岩波ジュニア文庫)、『思考からの逃走』、『ネット炎上』(日本経済新聞出版社)など。
●吉田 雅裕(よしだ まさひろ)
1985年生まれ。山口県出身。東京大学大学院博士課程修了。博士(学際情報学)。日本学術振興会特別研究員を経て、2013年に日本電信電話株式会社に入社。5Gと自動運転に関する研究開発を経て、現在、中央大学国際情報学部准教授。コンピュータネットワークとAIに関する研究教育活動に従事。中央大学AI・データサイエンスセンター所員、東京大学客員研究員、電子情報通信学会幹事。
吉田, 雅裕, 1985-