機械学習の可能性
書籍情報
発売日 : 2022年12月28日
著者/編集 : 計測自動制御学会/浮田 浩行/濱上 知樹/藤吉 弘亘/大町 真一郎/戸田 智基
出版社 : コロナ社
発行形態 : 全集・双書
書籍説明
内容紹介
機械学習の歴史や種類,基本的なアルゴリズムから,画像認識や文字認識,ゲーム理論,音声生成や制御,また応用例として医療や社会インフラ,外観検査,語学学習に至るまで網羅的に解説。開発環境についても言及する。
目次
1. 機械学習の基礎
1.1 機械学習とは
1.1.1 機械学習の歴史
1.1.2 機械学習の手順
1.1.3 機械学習の設計
1.2 機械学習の種類
1.2.1 教師あり学習
1.2.2 教師なし学習
1.2.3 半教師あり学習
1.2.4 敵対的学習
1.2.5 強化学習
1.2.6 オンライン・オフライン・ミニバッチ学習
1.3 機械学習アルゴリズム
1.3.1 線形回帰,パーセプトロン,ロジスティック回帰
1.3.2 ニューラルネットワークとディープニューラルネットワーク
1.3.3 サポートベクタマシン
1.3.4 決定木
1.3.5 アンサンブル学習
1.3.6 クラスタリング
1.3.7 自己組織化マップ
1.3.8 強化学習アルゴリズム
2. 機械学習と画像認識
2.1 画像認識
2.2 画像認識における問題設定
2.2.1 画像照合
2.2.2 物体検出
2.2.3 画像分類
2.2.4 シーン理解(セマンティックセグメンテーション)
2.2.5 特定物体認識
2.3 画像認識技術の変遷
2.3.1 特徴点検出・特徴量記述
2.3.2 特徴抽出
2.3.3 識別(機械学習
2.4 深層学習による画像認識
2.4.1 畳み込みニューラルネットワーク(CNN
2.4.2 物体検出への適用
2.4.3 シーン理解(セマンティックセグメンテーション)への適用
2.4.4 マルチタスク学習
2.5 機械学習と画像認識の今後
3. 機械学習と文字検出・認識
3.1 文字認識の意義と歴史
3.2 文字認識技術と畳み込みニューラルネットワーク
3.3 環境中の文字列の検出
3.4 環境中の文字列の認識
3.5 学習データの生成
4. 機械学習と音声生成:
統計的手法に基づく音声信号モデリング
4.1 音声生成過程と音声信号の特徴
4.2 ソースフィルタ理論に基づく数理的手法
4.2.1 ソースフィルタ理論による音声信号モデリング
4.2.2 確率的手法
4.2.3 利点と欠点
4.3 波形接続に基づく事例ベース手法
4.3.1 波形接続による音声信号モデリング
4.3.2 利点と欠点
4.4 深層学習に基づく信号波形モデリング手法
4.4.1 深層波形生成モデルによる音声信号モデリング
4.4.2 他手法との比較
4.5 さらなる発展に向けて
5. 機械学習とゲーム理論:
ゲーム理論とオンライン意思決定
5.1 均衡計算,最適化,後悔最小化
5.2 モデル
5.3 均衡計算と機械学習
5.4 後悔最小化と粗相関均衡
6. 機械学習と制御:連続行動空間における強化学習
6.1 複雑化する制御対象と強化学習の台頭
6.2 強化学習
6.2.1 問題設定
6.2.2 価値関数
6.2.3 連続行動空間における方策関数
6.3 方策関数のモデル
6.3.1 ガウス分布(正規分布
6.3.2 スチューデントのt分布
6.3.3 ベータ分布
6.3.4 混合分布
6.3.5 Flowベースモデル
6.4 制御と強化学習の展望
7. 機械学習と開発環境:深層学習フレームワークの動向
7.1 深層学習フレームワークとは
7.2 基礎知識
7.2.1 ディープニューラルネットワーク(DNN)の構造
7.2.2 Define and Run/Define by Run
7.3 フレームワーク比較
7.3.1 TensorFlow
7.3.2 PyTorch/Caffe2
7.3.3 Chainer
7.3.4 Caffe
7.3.5 Keras
7.3.6 MatConvNet
7.3.7 Darknet
7.4 フレームワーク間互換性
7.5 実行速度比較
7.6 推奨フレームワーク
8. 機械学習と医療応用
8.1 医療と技術情報
8.2 機械学習による医用画像異常検知
8.2.1 敵対的生成ネットワーク(GAN)
8.2.2 GANによる異常検知
8.2.3 眼底異常検出
8.3 機械学習による医用動画像動体追尾
8.3.1 移動推定に関する従来技術と課題
8.3.2 変形を伴う動体の移動量推定
8.3.3 医用動画像への応用
8.4 機械学習による検出問題
8.4.1 AdaBoost
8.4.2 cost-sensitive learning
8.4.3 ATBoost
8.4.4 生殖医療における精子検出への応用
9. 機械学習と計測:社会インフラへの応用
9.1 社会インフラの抱える課題とAI技術
9.2 都市浸水リスク軽減のための計測技術
9.3 CNNを用いたアプローチ
9.4 水位予測モデル
9.4.1 予測モデルの入力データ
9.4.2 予測モデルの概要
9.4.3 畳み込み層
9.4.4 プーリング層
9.4.5 全結合層
9.5 予測精度と課題
9.5.1 予測精度
9.5.2 課題
9.6 予測根拠の見える化
9.6.1 Grad-Camの概要
9.6.2 水位予測モデルにおける予測根拠の見える化
9.7 社会インフラの課題解決に向けた今後の取組み
10. 機械学習と外観検査
10.1 機械学習の発展と外観検査
10.2 外観検査に機械学習を利用する際の問題設定
10.3 外観検査に利用される機械学習手法
10.3.1 handcrafted featureを用いる手法
10.3.2 深層学習を用いる手法
10.4 データ処理
10.4.1 学習データの準備
10.4.2 データに対する前処理
10.4.3 評価指標の選択
10.4.4 汎化性能の評価
10.4.5 認識精度向上のための方法
10.5 事例解説
10.5.1 鋳造部品の欠陥検出
10.5.2 細胞分裂イベントに関する外観検査
10.5.3 X線CT撮影による外観検査
10.5.4 良品サンプルのみの学習による異常検知
10.6 外観検査技術の普及に向けて
11. 機械学習と語学学習:語学学習のための英会話シミュレータ
11.1 日本における英語学習環境の問題
11.2 音声対話システムの課題
11.2.1 音素の多様性
11.2.2 発話継続を重視した頑健な発話理解
11.2.3 発話ガイドによる会話の体験
11.3 日本語母語話者の英語発話認識
11.3.1 混合音韻音声認識
11.3.2 文法モデルによる発話例の提示とフィードバック
11.4 学校環境での実証実験と実利用
11.5 語学学習のパートナーを目指して
引用・参考文献
索引
1.1 機械学習とは
1.1.1 機械学習の歴史
1.1.2 機械学習の手順
1.1.3 機械学習の設計
1.2 機械学習の種類
1.2.1 教師あり学習
1.2.2 教師なし学習
1.2.3 半教師あり学習
1.2.4 敵対的学習
1.2.5 強化学習
1.2.6 オンライン・オフライン・ミニバッチ学習
1.3 機械学習アルゴリズム
1.3.1 線形回帰,パーセプトロン,ロジスティック回帰
1.3.2 ニューラルネットワークとディープニューラルネットワーク
1.3.3 サポートベクタマシン
1.3.4 決定木
1.3.5 アンサンブル学習
1.3.6 クラスタリング
1.3.7 自己組織化マップ
1.3.8 強化学習アルゴリズム
2. 機械学習と画像認識
2.1 画像認識
2.2 画像認識における問題設定
2.2.1 画像照合
2.2.2 物体検出
2.2.3 画像分類
2.2.4 シーン理解(セマンティックセグメンテーション)
2.2.5 特定物体認識
2.3 画像認識技術の変遷
2.3.1 特徴点検出・特徴量記述
2.3.2 特徴抽出
2.3.3 識別(機械学習
2.4 深層学習による画像認識
2.4.1 畳み込みニューラルネットワーク(CNN
2.4.2 物体検出への適用
2.4.3 シーン理解(セマンティックセグメンテーション)への適用
2.4.4 マルチタスク学習
2.5 機械学習と画像認識の今後
3. 機械学習と文字検出・認識
3.1 文字認識の意義と歴史
3.2 文字認識技術と畳み込みニューラルネットワーク
3.3 環境中の文字列の検出
3.4 環境中の文字列の認識
3.5 学習データの生成
4. 機械学習と音声生成:
統計的手法に基づく音声信号モデリング
4.1 音声生成過程と音声信号の特徴
4.2 ソースフィルタ理論に基づく数理的手法
4.2.1 ソースフィルタ理論による音声信号モデリング
4.2.2 確率的手法
4.2.3 利点と欠点
4.3 波形接続に基づく事例ベース手法
4.3.1 波形接続による音声信号モデリング
4.3.2 利点と欠点
4.4 深層学習に基づく信号波形モデリング手法
4.4.1 深層波形生成モデルによる音声信号モデリング
4.4.2 他手法との比較
4.5 さらなる発展に向けて
5. 機械学習とゲーム理論:
ゲーム理論とオンライン意思決定
5.1 均衡計算,最適化,後悔最小化
5.2 モデル
5.3 均衡計算と機械学習
5.4 後悔最小化と粗相関均衡
6. 機械学習と制御:連続行動空間における強化学習
6.1 複雑化する制御対象と強化学習の台頭
6.2 強化学習
6.2.1 問題設定
6.2.2 価値関数
6.2.3 連続行動空間における方策関数
6.3 方策関数のモデル
6.3.1 ガウス分布(正規分布
6.3.2 スチューデントのt分布
6.3.3 ベータ分布
6.3.4 混合分布
6.3.5 Flowベースモデル
6.4 制御と強化学習の展望
7. 機械学習と開発環境:深層学習フレームワークの動向
7.1 深層学習フレームワークとは
7.2 基礎知識
7.2.1 ディープニューラルネットワーク(DNN)の構造
7.2.2 Define and Run/Define by Run
7.3 フレームワーク比較
7.3.1 TensorFlow
7.3.2 PyTorch/Caffe2
7.3.3 Chainer
7.3.4 Caffe
7.3.5 Keras
7.3.6 MatConvNet
7.3.7 Darknet
7.4 フレームワーク間互換性
7.5 実行速度比較
7.6 推奨フレームワーク
8. 機械学習と医療応用
8.1 医療と技術情報
8.2 機械学習による医用画像異常検知
8.2.1 敵対的生成ネットワーク(GAN)
8.2.2 GANによる異常検知
8.2.3 眼底異常検出
8.3 機械学習による医用動画像動体追尾
8.3.1 移動推定に関する従来技術と課題
8.3.2 変形を伴う動体の移動量推定
8.3.3 医用動画像への応用
8.4 機械学習による検出問題
8.4.1 AdaBoost
8.4.2 cost-sensitive learning
8.4.3 ATBoost
8.4.4 生殖医療における精子検出への応用
9. 機械学習と計測:社会インフラへの応用
9.1 社会インフラの抱える課題とAI技術
9.2 都市浸水リスク軽減のための計測技術
9.3 CNNを用いたアプローチ
9.4 水位予測モデル
9.4.1 予測モデルの入力データ
9.4.2 予測モデルの概要
9.4.3 畳み込み層
9.4.4 プーリング層
9.4.5 全結合層
9.5 予測精度と課題
9.5.1 予測精度
9.5.2 課題
9.6 予測根拠の見える化
9.6.1 Grad-Camの概要
9.6.2 水位予測モデルにおける予測根拠の見える化
9.7 社会インフラの課題解決に向けた今後の取組み
10. 機械学習と外観検査
10.1 機械学習の発展と外観検査
10.2 外観検査に機械学習を利用する際の問題設定
10.3 外観検査に利用される機械学習手法
10.3.1 handcrafted featureを用いる手法
10.3.2 深層学習を用いる手法
10.4 データ処理
10.4.1 学習データの準備
10.4.2 データに対する前処理
10.4.3 評価指標の選択
10.4.4 汎化性能の評価
10.4.5 認識精度向上のための方法
10.5 事例解説
10.5.1 鋳造部品の欠陥検出
10.5.2 細胞分裂イベントに関する外観検査
10.5.3 X線CT撮影による外観検査
10.5.4 良品サンプルのみの学習による異常検知
10.6 外観検査技術の普及に向けて
11. 機械学習と語学学習:語学学習のための英会話シミュレータ
11.1 日本における英語学習環境の問題
11.2 音声対話システムの課題
11.2.1 音素の多様性
11.2.2 発話継続を重視した頑健な発話理解
11.2.3 発話ガイドによる会話の体験
11.3 日本語母語話者の英語発話認識
11.3.1 混合音韻音声認識
11.3.2 文法モデルによる発話例の提示とフィードバック
11.4 学校環境での実証実験と実利用
11.5 語学学習のパートナーを目指して
引用・参考文献
索引
著者情報
浮田, 浩行
濱上, 知樹
浮田 浩行
計測自動制御学会
濱上 知樹
藤吉 弘亘
大町 真一郎
戸田 智基
岩崎 敦
小林 泰介
鈴木 亮太
木村 雄喜
橋本 大樹
玉垣 勇樹
水谷 麻紀子
永田 毅
木村 光成
李 晃伸
川嶋 宏彰