【初心者向け】基礎から学ぶ強化学習ハンズオン(Deep Q-Network編)
2019/11/13(水)20:00
〜
22:00
開催
ブックマーク
参加枠 | 申込形式 | 参加費 | 参加者 |
---|---|---|---|
セミナー参加者枠
|
先着順 |
4,000円
現金支払い
|
3人 / 定員6人 |
イベント内容
内容概要
強化学習について勉強したいという話をよく伺うのですが、なかなか推奨できる本が
少ないので、初心者向けのイベントを企画させていただきました。
問題定義としてのマルコフ決定過程(MDP)、ベルマン方程式による価値の計算、
ニューラルネットワークによる価値関数の近似などの理解を通してDeep Q-Network
の理解まで繋げられたらと思います。
進行としては前半で仕組みの解説、後半で実装を元にしたハンズオンを行います。
↓二時間だけで定着までサポートできるように解説するのは難しいということもあり、
電子書籍形式でもまとめてみましたのでよろしければこちらもご検討ください!!
https://note.mu/lib_arts/n/n8cf4cbe2dce4
開催日程
11/13(水)
受付: 19:50〜20:00
講義: 20:00〜22:00
※ 途中5〜10分程、休憩を設ける予定です。
※ 19:40より前の入室は原則としてお断りします。
アジェンダ
◆ 講義編
系列モデリングとマルコフ決定過程
エージェントと環境
ベルマン方程式による状態や状態における行動の価値の計算
ニューラルネットワークによる状態行動価値関数の近似
Deep Q-Network
◆ 演習編(ハンズオン)
OpenAI Gymを実際に動かしてみる
PyTorchのDeep Q-Networkの実装を確認する
◆ 発展編(時間に余裕があれば概要だけお伝えします)
Rainbow、Ape-X、R2D2、R2D3
会場
水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F
対象者
・強化学習に興味がある方
・強化学習のプログラムを動かしてみたい方
※
初心者〜中級者を前提とした進行としますので、極力難しい言葉や数式は使わないで
進行するようにします。
講師プロフィール
東大工学部卒。
データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。
また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。
初心者向けの指導実績も多く、1,000名近い。
当日までの準備
Python3.6環境でOpenAI Gymが動くようにしてきていただけたらと思います。
費用
4,000円(2h)
※
・領収書発行の際は事務手数料として追加1,000円のお支払いをよろしくお願いいたします
定員
6名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を反映しません)
ご参加にあたってのお願い
無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
(7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)
モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。