Reinforcement Learning Meetup #07
イベント内容
Math & Codingは数学とプログラミングの知識を向上したい方が集い学び合う場です。 機械学習やデータ分析予測業務の仕事のニーズが高まるにつれ数学とプログラミングの 両方を習得していくことはとても重要です。 どちらも習得に時間はかかりますが、学べば品質の高い仕事につながると考えます。
内容
「Reinforcement Learning An Introduction」(Richard S. Sutton and Andrew G. Barto)second edition
http://incompleteideas.net/book/bookdraft2018jan1.pdf
を読んでいきます。
サンプルコードは
http://incompleteideas.net/book/the-book-2nd.html
にあがっておりそちらも参照します。
「Reinforcement Learning An Introduction」について
著者の一人であるSutton氏は強化学習の第一人者で現在はDeepMindに所属されています。
「Reinforcement Learning An Introduction」は2000年に「強化学習」(森北出版)として出版されていますがそれ以降、強化学習の技術も進歩していることから今は、第二版の出版計画が進行中です。
オンラインドラフト版(英語)が無料で公開されており、サンプルコード(Python)がGithubにあげられています。
今回はそちらをテキストにして学びを深めていきます。
進め方
参加者同士が数式を含む文章と実装を相互に参照し理解を深めていきます。
運営者は議論の整理をしたりペースを考えて進行します。
参加者は質問したり、わかっている範囲で他の方の質問に答えたりします。
聴くだけの参加の仕方もOKです。
予習は前提としませんが、ある程度目を通してきた方が満足度が高まります。
範囲
Chapter 3.「Finite Markov Decision Processes」
強化学習の思考の枠組みであるMarkov Decision Processについて、本文で出題されている問題(Exercise)を中心にディスカッションします。
今回はExercise 3.14より最後まで
対象者
強化学習に関心がありベースから理解していきたいエンジニア
強化学習の理論に関心があるアルゴリズム開発者
20:00以降にお越しの場合
入り口が施錠されますので、インターホンにて801号で呼び出してください。
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。