第9回自然言語処理企画:分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み

イベント内容

この勉強会は、Zoomでのオンライン勉強会です。

・有料参加枠 200円 30名 先着順
参加費はZoom環境などの勉強会用の費用、今後シンポジウム開催時の講師謝金などに、充当させていただきたいと思います。

AI&機械学習しよう!(Do2dle)は、プログラム、システム開発の現場の人を中心にしたソース&論文輪読会を進めて、AIを作れる人を増やすことを目的とするグループです。 AIに関するホットな話題を取り入れながら情報交換できる場を作っていきます。定期的にミートアップを開催していきます。

概要

(1) ビデオゲームAtariにおいて, State-of-the-Art(SotA)を実現した分散型強化学習手法について紹介します.
Ape-X(2018)[1], R2D2(2019)[2], MuZero(2019)[3], Agent57(2020)[4] を予定しています.

(2) 2018年にAtariのSotAを達成したApe-X[1]のサブセットを, Pythonを使った分散計算フレームワークRay[6]によって実装し, Amazon EC2上にクラスタを構築して分散計算を行う方法を解説します.

【参考資料】

[1] Horgan et al., "Distributed Prioritized Experience Replay", ICLR2018, 2018.
[2] Kapturowski et al., "Recurrent Experience Replay in Distributed Reinforcement Learning", ICLR2019, 2019.
[3] Schrittwieser et al., "Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model", arXiv preprint arXiv:1911.08265, 2019.
[4] Badia et al., "Agent57: Outperforming the Atari Human Benchmark", arXiv preprint arXiv:2003.13350, 2020.
[5] Sutton et al., "Reinforcement Learning: An Introduction second edition", MIT Press, 2018.
[6] The Ray Team, "Ray - Fast and Simple Distributed Computing", 2020.

タイムスケジュール

  • 14:55 ~ 開場
  • 15:00 ~ 16:30 説明(途中10分ほど休憩あり)
  • 16:30 ~ 17:00 質疑応答、自由討論
  • 17:00  終了

会場

開催日前にアクセス方法など注意事項はご連絡いたします。 また、Zoomパーフェクトマニュアルがあります。 今後色々なところでオンラインイベントが行われるようになると思います。 参考にしていただければ幸いです。 https://zoomy.info/zoom_perfect_manual/

参加費

  • 一部有料200円

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。