TOP

(延期)第25回 強化学習アーキテクチャ勉強会

イベント内容

重要なお知らせ9/3(月)

9/4(火)に予定しておりました「第25回 強化学習アーキテクチャ勉強会」ですが,台風21号の接近が予測されており,安全を考慮いたしました結果,延期とさせていただきます.イベント直前のご案内になりましたことをお詫び申し上げます.

なお,9/4(火)に予定していたイベントの内容は,9/18(火)におこなう予定です. 再来週9/18(火)に皆さまにお会いできることを楽しみにしております. ご来場お待ちしております.

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 論文&実験結果の紹介:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:勝田隼一郎(GMOインターネット株式会社)

  • タイトル:
    論文&実験結果の紹介:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

  • アブストラクト:
    マルチエージェント強化学習では、複数のエージェントが自身の報酬を最大化するように、競合や協調といった行動を学習する。学習される行動は、設定された環境により大きく変化する。今回、発表者はゲーム環境を変化させることで、マルチエージェントの学習がどのように変化するかの実験を行った。具体的には、OpenAIが作成したマルチエージェント強化学習用の環境ライブラリを用いて、参考論文中の実験結果の再現を試みた。さらにライブラリを使い新しいゲーム(環境)を作成して、マルチエージェント強化学習の実験を行った。参考論文は本勉強会の第18回で既に紹介されているため、論文紹介は最低限にとどめ、実験の説明および得られた結果と知見の紹介をメインに発表を行う予定である。

  • 参考文献:
    [1] Lowe, Ryan, et al. "Multi-agent actor-critic for mixed cooperative-competitive environments." Advances in Neural Information Processing Systems. 2017. https://arxiv.org/abs/1706.02275  

  • 関連資料:
    [1] 本発表で話す予定のスライド1: https://www.slideshare.net/JunichiroKatsuta/ss-108099238
    [2] 本発表で話す予定のスライド2: https://www.slideshare.net/JunichiroKatsuta/ss-108099542
    [3] 本発表で話す予定の実験のGitHub codes: https://github.com/jkatsuta/exp-18-1q

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
2018/09/18(火)
18:45〜20:35
参加者
45人 / 定員45人
会場
φcafe
東京都文京区本郷5丁目24-5 角川本郷ビル6F

注目のポジション