強化学習(第2版)

書籍情報

発売日 : 2022年11月01日

著者/編集 : R. Sutton/A. Barto/奥村 エルネスト 純/鈴木 雅大/松尾 豊/三上 貞芳

出版社 : 森北出版

発行形態 : 単行本

書籍説明

内容紹介

発展的手法、心理学・神経科学との関係、AlphaGoなどの新しい話題を大幅増補。

目次

第1章 序

第I部 テーブル形式の解法
第2章 多腕バンディット問題
第3章 有限マルコフ決定過程
第4章 動的計画法
第5章 モンテカルロ法
第6章 TD学習
第7章 nステップ・ブートストラップ法
第8章 テーブル形式手法におけるプランニングと学習

第II部 近似による解法
第9章 近似を用いた方策オン型予測
第10章 関数近似を用いた方策オン型制御
第11章 近似を用いた方策オフ型手法
第12章 適格度トレース
第13章 方策勾配法

第III部 さらに深く
第14章 心理学
第15章 神経科学
第16章 応用と事例紹介
第17章 強化学習のこれから

著者情報

R. Sutton
Sutton, Richard S
Barto, Andrew G
A. Barto
奥村 エルネスト 純
株式会社エウレカ
奥村, エルネスト純
鈴木, 雅大
鈴木 雅大
東京大学特任助教 博(工)
松尾 豊
東京大学教授 博(工)
松尾, 豊, 1975-
三上 貞芳
はこだて未来大学教授 工博
三上, 貞芳, 1962-
山川 宏
全脳アーキテクチャ・イニシアティブ 代表
山川, 宏, 1965- 人工知能
今井 翔太
東京大学
川尻 亮真
株式会社Preferred Networks
菊池 悠太
株式会社Preferred Networks
鮫島 和行
玉川大学教授 博(工)
陣内 佑
株式会社Lily MedTech
髙橋 将文
株式会社DeepX
谷口 尚平
東京大学
藤田 康博
株式会社Preferred Networks
前田 新一
株式会社Preferred Networks 博(理)
松嶋 達也
東京大学