【入門者・初心者向け】基礎から学ぶ強化学習入門(Deep Q-Network編)
2019/07/13(土)18:30
〜
21:00
開催
ブックマーク
参加枠 | 申込形式 | 参加費 | 参加者 |
---|---|---|---|
セミナー参加者枠
|
先着順 |
4,000円
現金支払い
|
1人 / 定員8人 |
イベント内容
内容概要
強化学習について勉強したいという話をよく伺うのですが、なかなか推奨できる本が
少ないので、超初心者向けのイベントを企画させていただきました。
問題定義としてのマルコフ決定過程(MDP)、ベルマン方程式による価値の計算、
ニューラルネットワークによる価値関数の近似などの理解を通してDeep Q-Network
の理解まで繋げられたらと思います。
進行としては前半で仕組みの解説、後半で実装を元にしたハンズオンを行います。
開催日程
7/13(土)
受付: 18:20〜18:30
講義: 18:30〜21:00
※
途中5分ほどの休憩を設ける予定です。
アジェンダ
◆ 講義編
系列モデリングとマルコフ決定過程
エージェントと環境
ベルマン方程式による状態や状態における行動の価値の計算
ニューラルネットワークによる状態行動価値関数の近似
Deep Q-Network
◆ 演習編(ハンズオン)
OpenAI Gymを動かしながら、強化学習の問題定義についての理解を深めます。
会場
水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F
対象者
・強化学習に興味がある方
・強化学習のプログラムを動かしてみたい方
※
超初心者〜中級者を前提とした進行としますので、極力難しい言葉や数式は使わないで
進行するようにします。
当日までの準備
Python3.6環境でTensorFlowが動くようにしてきていただけたらと思います。
https://lib-arts.hatenablog.com/entry/rl_trend1
費用
4,000円(2.5h)
※
・領収書発行の際は事務手数料として追加1,000円のお支払いをよろしくお願いいたします
定員
8名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を反映しません)
ご参加にあたってのお願い
無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
(7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)
モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。