MuZeroベースで学ぶ、モデルベース(model-based)強化学習の研究トレンド

2020/01/13(月)16:00 〜 18:00 開催
ブックマーク
参加枠申込形式参加費 参加者
通常参加者枠
先着順 6,000円
現金支払い
1人 / 定員3人
テキスト購入者枠
先着順 5,000円
現金支払い
1人 / 定員2人

イベント内容

内容概要

つい最近出た強化学習のモデルにMuZero(Mastering Atari, Go, Chess and 
Shogi by Planning with a Learned Model)があります。
https://arxiv.org/abs/1911.08265
MuZeroはAtariだけでなく、囲碁やチェス、将棋など適用範囲は広くなっています。

MuZeroはQ-Learning(model-free)をベースとするDeep Q-Networkとは違い、
モデルベース(model-base)のアプローチで取り組まれています。

本セミナーではMuZeroについて理解するにあたって、model-basedのアプローチの
基本的な考え方や、AlphaZeroの論文との関連について見ながら解説を行なって
いければと考えています。


↓大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した
上でのご参加をお勧めします。
https://note.com/lib_arts/n/n8cf4cbe2dce4
(有料ですが、購入いただいた方はその分参加費を割り引きますので総額は変わらないです)

開催日程

1/13(月)
受付: 15:50〜16:00
講義: 16:00〜18:00

※ 途中5分ほどの休憩を設ける予定です。
※ 19:40より前の入室は原則としてお断りします。

アジェンダ

1. 前提知識の確認(50分)
  強化学習の問題設定(Sequential Decision Making Problem)
  モデルベース(model-based)強化学習について
  AlphaZeroについて

2. MuZeroについて(60分)
  ↓下記などを参考にします。
  https://lib-arts.hatenablog.com/entry/rl_paper4

3. まとめ(10分)

※ 全体の流れは変えませんが、細かい時間配分は内容踏まえて変更する可能性があります。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

対象者

・MuZeroの内容に興味がある方
・モデルベース(model-based)強化学習に興味がある方
・強化学習、DeepLearningの基本的な内容が把握できている方

講師プロフィール

東大工学部卒。
データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。
また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。
初心者向けの指導実績も多く、1,000名近い。

当日までの準備

・大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した
上でのご参加をお勧めします。
https://note.com/lib_arts/n/n8cf4cbe2dce4

・model-based強化学習について気になる方は下記の8章が詳しいようなのでこちらを
確認するのが良いと思います。
https://www.andrew.cmu.edu/course/10-703/textbook/BartoSutton.pdf
(model-based強化学習については当日時間を取って解説しますので、気になる方だけ
予習いただけたら十分です。)

費用

・6,000円(2h)
(テキスト購入者は5,000円とします。購入の上、購入が証明できるページの印刷など
いただけたら確認がスムーズとなるので嬉しいです。)

※ 領収書発行の際は事務手数料として追加2,000円のお支払いをよろしくお願いいたします
※ 準備にあたっては可能な限りベストを尽くしますが、体裁の整ったセミナーとして開催するなら
参加費が3倍くらいになると思うので、参加にあたってあまり多くを期待し過ぎないようにお願いします。

定員

5名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を
反映しません。最大でも16名までで考えています。)

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
(7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。

関連するイベント