第9回 強化学習アーキテクチャ勉強会

イベント内容

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:55 講演:高次行動の抽象化(甲野 佑)発表45分、質疑応答15分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:甲野 佑 (DeNA)

  • タイトル: 高次行動の抽象化

  • アブストラクト: スキルやオプションなど、強化学習で獲得される行動系列をより抽象度の高い表現に置き換えようとする研究分野がある。高次行動を抽象化する利点は様々あるが、プリミティブな試行錯誤では難しい長期的なアプローチでの探索が可能になる等が考えられる。また、有用なスキルを固定化、抽象化することで新規の環境に対する転用の効率化にも繋がりうる。 直感的に、人間の意思決定のレベルではプリミティブな行動から徐々に高次の行動=スキルでの意思決定に移行されていく。このようなプリミティブな行動の学習から高次の行動への抽象化に関する研究について、アプローチの異なる複数の論文を紹介する。

  • 参考文献:
    [1] Vezhnevets, A., Mnih, V., Osindero, S., Graves, A., Vinyals, O., Agapiou, J., et al.: Strategic attentive writer for learning macro-actions. In: Advances in Neural Information Processing Systems, pp. 3486–3494 (2016). [2] Saxe, A. M., Earle, A. C., & Rosman, B.: Hierarchy Through Composition with Multitask LMDPs. Proceedings of the 34th International Conference on Machine Learning, 70, 3017–3026. (2017).
    http://proceedings.mlr.press/v70/saxe17a.html
    [3] Guttenberg, N., Biehl, M., & Kanai, R.: Learning body-affordances to simplify action spaces, 1–4. (2017). http://arxiv.org/abs/1708.04391

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

類似しているイベント