BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:第24回 強化学習アーキテクチャ勉強会
X-WR-CALNAME:第24回 強化学習アーキテクチャ勉強会
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:690933@techplay.jp
SUMMARY:第24回 強化学習アーキテクチャ勉強会
DTSTART;TZID=Asia/Tokyo:20180821T184500
DTEND;TZID=Asia/Tokyo:20180821T203500
DTSTAMP:20260508T050458Z
CREATED:20180815T140259Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/69093
 3?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\nはじめに\n
 強化学習は環境に柔軟に適応する知能エージェントに
 おける基本機能と考えられます。近年は深層学習など
 のアーキテクチャとして、認識技術と組み合わされて
 自動運転などの実践的な場でつかわれれはじめており
 、さらにロボットなどにおいても今後は適用されてゆ
 くシーンが増えてゆくでしょう、こうした背景から、
 実践的な強化学習や，実世界で動かす強化学習（ロボ
 ット・自動運転），強化学習を部品として組み合わせ
 る（アーキテクチャ），といったトピックについて重
 視し情報共有する場として強化学習アーキテクチャ勉
 強会を開始しました。\n本勉強会において積極的に議
 論に加わっていただき、今後、論文紹介などの形で貢
 献いただけるかたの参加をお待ちしております。\n当
 勉強会の運営方針などについては、https://rlarch.connpass.c
 om/ を御覧ください。\n\nGoogle Group: https://goo.gl/xznKlY （
 注：KlYのIは「L」の小文字です）\nSlack: https://join.slack.c
 om/t/rlarch/shared_invite/MjM2Mzc3MDE1MzYyLTE1MDQ2MjIzNDItNjFmNmU2NWJlYg\
 n\nスケジュール\n\n18:50 〜18:55  オープニング\n18:55〜19:4
 5 論文紹介：Unsupervised Predictive Memory in a Goal-Directed Agent 
 (発表35分、質疑応答15分)\n\n※ 19:00にビル入り口が施錠
 されるため、19時以前にお越しください（万が一19時を
 過ぎてしまった場合はインターホンにてご連絡くださ
 い）\n講演概要：\n発表者：梶原 侑馬（東京大学）\n\n\
 nタイトル： 論文紹介："Unsupervised Predictive Memory in a Goal
 -Directed Agent"\n\n\nアブストラクト：\nDifferentiable Neural Com
 puters(DNC)のように，近年End-to-endに学習可能な，外部メ
 モリを持ったニューラルネットワーク構造（Memory Augmen
 ted Neural Networks）がいくつか提案されており，強化学習
 においても，より長期的な経験保持が可能になると期
 待されている．しかし，環境から受け取る報酬を最大
 化するという行動則のみで学習するだけでは，必ずし
 も経験を適切な形式で表現できているわけではなく，
 経験の想起に長いタイムラグが発生するタスクや，環
 境が変化するような複雑なタスクでは失敗することが
 多い．\n今回ご紹介するMERLIN(Memory\, RL\, and Inference Networ
 k)というモデルは，次のステップ時の環境（入力，報
 酬）を予測するという補助タスクを同時に解くことで
 ，経験を適切な形で外部メモリに保存・想起すること
 を可能にし，3次元迷路のような複雑な環境でも，タス
 クを解くことに成功している．MERLINは以下の心理学，
 神経科学におけるモデル・原理とも深く関わっており
 ，実世界指向なエージェントを考える上でも興味深い
 モデルである．\n   - Predictive Coding\n   - GluckとMyersによ
 る海馬の表現理論\n\n\n参考文献： \n[1] Wayne\, Hung\, et al.
  "Unsupervised Predictive Memory in a Goal-Directed Agent." arXiv preprin
 t\, https://arxiv.org/abs/1803.10760\n[2] Graves\, Wayne\, et al. "Hybrid
  computing using a neural network with dynamic external memory." Nature\,
  https://www.nature.com/articles/nature20101\n\n
LOCATION:φcafe 東京都文京区本郷5丁目24-5　角川本郷ビル6F
URL:https://techplay.jp/event/690933?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR