強化学習(第2版)

データ分析・機械学習

機械学習

書籍情報

発売日 : 2022年11月01日

著者／編集 : R. Sutton/A. Barto/奥村エルネスト純/鈴木雅大/松尾豊/三上貞芳

出版社 : 森北出版

発行形態 : 単行本

書籍説明

内容紹介

発展的手法、心理学・神経科学との関係、ＡｌｐｈａＧｏなどの新しい話題を大幅増補。

第1章　序

第I部　テーブル形式の解法
第2章　多腕バンディット問題
第3章　有限マルコフ決定過程
第4章　動的計画法
第5章　モンテカルロ法
第6章　TD学習
第7章　nステップ・ブートストラップ法
第8章　テーブル形式手法におけるプランニングと学習

第II部　近似による解法
第9章　近似を用いた方策オン型予測
第10章　関数近似を用いた方策オン型制御
第11章　近似を用いた方策オフ型手法
第12章　適格度トレース
第13章　方策勾配法

第III部　さらに深く
第14章　心理学
第15章　神経科学
第16章　応用と事例紹介
第17章　強化学習のこれから

著者情報

R. Sutton

Sutton, Richard S

Barto, Andrew G

A. Barto

奥村エルネスト純

株式会社エウレカ

奥村, エルネスト純

鈴木, 雅大

鈴木雅大

東京大学特任助教博（工）

松尾豊

東京大学教授博（工）

松尾, 豊, 1975-

三上貞芳

はこだて未来大学教授工博

三上, 貞芳, 1962-

山川宏

全脳アーキテクチャ・イニシアティブ代表

山川, 宏, 1965- 人工知能

今井翔太

東京大学

川尻亮真

株式会社Preferred Networks

菊池悠太

株式会社Preferred Networks

鮫島和行

玉川大学教授博（工）

陣内佑

株式会社Lily MedTech

髙橋将文

株式会社DeepX

谷口尚平

東京大学

藤田康博

株式会社Preferred Networks

前田新一

株式会社Preferred Networks 博（理）

松嶋達也

東京大学

6,600円 (税込)

楽天

ブックマーク

強化学習(第2版)

書籍情報

書籍説明

内容紹介

目次

著者情報

類似書籍

関連イベント

【Honda×パナソニック】メーカーのエンジニアが先端技術を駆使して挑む次世代エネルギーマネジメントシステムの開発ー機械学習 / AI / デジタルツイン / クラウド / IoT ー

【Honda×パナソニック】メーカーのエンジニアが先端技術を駆使して挑む次世代エネルギーマネジメントシステムの開発ー機械学習 / AI / デジタルツイン / クラウド / IoT ー