MuZeroベースで学ぶ、モデルベース(model-based)強化学習の研究トレンド

イベント内容

内容概要

つい最近出た強化学習のモデルにMuZero(Mastering Atari, Go, Chess and 
Shogi by Planning with a Learned Model)があります
https://arxiv.org/abs/1911.08265
MuZeroはAtariだけでなく囲碁やチェス将棋など適用範囲は広くなっています

MuZeroはQ-Learning(model-free)をベースとするDeep Q-Networkとは違い
モデルベース(model-base)のアプローチで取り組まれています

本セミナーではMuZeroについて理解するにあたってmodel-basedのアプローチの
基本的な考え方やAlphaZeroの論文との関連について見ながら解説を行なって
いければと考えています


大枠としての強化学習の概念は既知としますので下記のテキストを軽く目を通した
上でのご参加をお勧めします
https://note.com/lib_arts/n/n8cf4cbe2dce4
有料ですが購入いただいた方はその分参加費を割り引きますので総額は変わらないです

開催日程

1/13(月)
受付: 15:5016:00
講義: 16:0018:00

 途中5分ほどの休憩を設ける予定です。
 19:40より前の入室は原則としてお断りします。

アジェンダ

1. 前提知識の確認(50)
  強化学習の問題設定(Sequential Decision Making Problem)
  モデルベース(model-based)強化学習について
  AlphaZeroについて

2. MuZeroについて(60)

3. まとめ(10)

 全体の流れは変えませんが、細かい時間配分は内容踏まえて変更する可能性があります。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

対象者

MuZeroの内容に興味がある方
・モデルベース(model-based)強化学習に興味がある方
・強化学習、DeepLearningの基本的な内容が把握できている方

講師プロフィール

東大工学部卒。
データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。
また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。
初心者向けの指導実績も多く、1,000名近い。

当日までの準備

・大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した
上でのご参加をお勧めします。
https://note.com/lib_arts/n/n8cf4cbe2dce4

model-based強化学習について気になる方は下記の8章が詳しいようなのでこちらを
確認するのが良いと思います。
https://www.andrew.cmu.edu/course/10-703/textbook/BartoSutton.pdf
model-based強化学習については当日時間を取って解説しますので、気になる方だけ
予習いただけたら十分です。)

費用

6,000円(2h
(テキスト購入者は5,000円とします。購入の上、購入が証明できるページの印刷など
いただけたら確認がスムーズとなるので嬉しいです。)

 領収書発行の際は事務手数料として追加2,000円のお支払いをよろしくお願いいたします
 準備にあたっては可能な限りベストを尽くしますが、体裁の整ったセミナーとして開催するなら
参加費が3倍くらいになると思うので、参加にあたってあまり多くを期待し過ぎないようにお願いします。

定員

7名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を
反映しません。最大でも16名までで考えています。)

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

類似しているイベント

SSDによる物体検出 理論と実装

中央区銀座2-14-4(銀座スクエア3階) 【東京メトロ日比谷線】東銀座駅徒歩4分/【東京メトロ有楽町線】銀座一丁目駅徒歩5分/【都営浅草線】宝町駅徒歩6分

10:00 〜13:00

connpass

2月 29 SAT