Trust Region Policy Optimization| 論文輪読会 #8
2018/06/21(木)19:30
〜
21:30
開催
ブックマーク
イベント内容
勉強会名
Trust Region Policy Optimization #8
勉強会内容概要
準備においてご協力いただけるようになってきて余裕が出てきたため、論文輪読会も開催していければと 思っています。 専門職以外の方にとってもなるべく費用対効果の高いものを選定したいなと考えました結果、最新の ものというよりは、後の研究にインパクトを与えたという視点で論文を選定できればと考えています。 ですので、専門職以外の方でも知っておいて損はない内容になるのかなと思っています。 (ベースを抑えれば最先端はある程度推測できますし、専門家と話す上でも齟齬が生じにくいです) 第八回目としては、深層強化学習のアルゴリズムであるTRPOについての2015年の論文を取り扱います。 https://arxiv.org/abs/1502.05477 https://arxiv.org/pdf/1502.05477.pdf 進め方としては、一冊分のざっくりの要約を発表者が用意してきて、読んでいくにあたって重要なポイント をお伝えし、読む際にどこをどういう風に読むと良いかを参加者の方々にイメージつく形にできればと 思っています。 (読んで来ないで読み始めるきっかけにしていただいても大丈夫です!)
開催日程
6/21(木) 受付:19:15〜19:30 勉強会:19:30〜21:30
会場
水道橋駅、神保町駅、九段下駅周辺 お申し込みいただいた方に別途ご連絡させていただきます。
タイムテーブル
◆簡単な講義&LT(1h) ・論文の構成、概要の説明 ・1. Introduction ・2. Preliminaries ・3. Monotonic Improvement Guarantee for General Stochastic Policies ・4. Optimization of Parameterized Policies ・5. Sample-Based Estimation of the Objective and Constraint ・6. Practical Algorithm ・7. Connections with Prior Work ・8. Experiments ・9. Discussion ・LT ◆講義内容の質疑応答&ディスカッション(1h) 基本的にはフリーで質疑応答やディスカッションができればと思います。 ※ ご都合よろしい方いたら終わった後近くの居酒屋で軽い懇親会をできればと思います。
想定参加者
論文を一人で読み進めるには不安な中級者から、読んだ上でディスカッションがしたい上級者の 方まで参考になる内容にできればと思っています。 ※ 初心者の方の参加も歓迎しますが、初歩的なご質問に時間は割きたくないので、別途運営している会の 初・中級者向けまでの講習の内容をご理解いただいている前提での発言をお願いいたします。
費用
2,000円 基本的に場所代+当日発表者への謝礼の想定です。 (誰か代わってくれる方いたら緩募です。『1,500円 × 聴講者数』だけお渡しします笑) ※ 自力で理解できる方でかつ事前に読んできて当日LTができる方は無料で大丈夫です。 (緩めのLTなので特に資料までは必要なく、ある程度読んだ上で5分ほど解釈を述べていただけるなら十分です)
定員
10名(会場キャパは余裕あるので、集まり次第で拡張させていただきます。)
備考
LT枠は飛び入りで構いませんが、発表希望者は事前に必ずご連絡ください。
注意事項
※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
情報提供元ページ(connpass)へ
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。