BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:第22回 強化学習アーキテクチャ勉強会
X-WR-CALNAME:第22回 強化学習アーキテクチャ勉強会
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:688472@techplay.jp
SUMMARY:第22回 強化学習アーキテクチャ勉強会
DTSTART;TZID=Asia/Tokyo:20180807T184500
DTEND;TZID=Asia/Tokyo:20180807T203500
DTSTAMP:20260427T142955Z
CREATED:20180801T100351Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/68847
 2?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\nはじめに\n
 強化学習は環境に柔軟に適応する知能エージェントに
 おける基本機能と考えられます。近年は深層学習など
 のアーキテクチャとして、認識技術と組み合わされて
 自動運転などの実践的な場でつかわれれはじめており
 、さらにロボットなどにおいても今後は適用されてゆ
 くシーンが増えてゆくでしょう、こうした背景から、
 実践的な強化学習や，実世界で動かす強化学習（ロボ
 ット・自動運転），強化学習を部品として組み合わせ
 る（アーキテクチャ），といったトピックについて重
 視し情報共有する場として強化学習アーキテクチャ勉
 強会を開始しました。\n本勉強会において積極的に議
 論に加わっていただき、今後、論文紹介などの形で貢
 献いただけるかたの参加をお待ちしております。\n当
 勉強会の運営方針などについては、https://rlarch.connpass.c
 om/ を御覧ください。\n\nGoogle Group : https://goo.gl/xznKlY （
 注：KlYのIは「L」の小文字です）\nSlack : https://join.slack.
 com/t/rlarch/shared_invite/MjM2Mzc3MDE1MzYyLTE1MDQ2MjIzNDItNjFmNmU2NWJlYg
 \n\nスケジュール\n\n18:50 〜18:55  オープニング\n18:55〜19:
 45 論文紹介：Learning a Prior over Intent via Meta-Inverse Reinforce
 ment Learning (発表35分、質疑応答15分)\n\n※ 19:00にビル入
 り口が施錠されるため、19時以前にお越しください（
 万が一19時を過ぎてしまった場合はインターホンにて
 ご連絡ください）\n講演概要：\n発表者：比嘉 亮太（NE
 C）\n\n\nタイトル：\n論文紹介：Learning a Prior over Intent vi
 a Meta-Inverse Reinforcement Learning\n\n\nアブストラクト：\n実
 問題に強化学習を適用する場合、どの様に目的を達成
 するための報酬関数の設定が問題となる。逆強化学習
 は、エキスパートの行動データより報酬関数を推定す
 ることで上記の課題を解決する。しかしながら、実世
 界で共通の変化（例えば、任意のタイプのドアを開く
 デモンストレーション）を網羅するデータセットを用
 意することは高いコストを有する。実際には、逆強化
 学習は報酬関数を復元することは困難な限られたデモ
 ンストレーションで行われる。先の問題を解決するた
 めに、本論文ではメタ学習を逆強化学習に組み合わせ
 、異なるタスクのデモンストレーションから報酬関数
 の共通の構造を学習する”prior over intent”学習を提案
 している。未知のダイナミクスに対する将来の研究課
 題を関連させて、今回の論文を紹介する。\n\n\n参考文
 献：\n[1] K. Xu\, E. Ratner\, A. Dragan\, S. Levine\, and C. Finn\, “
 Learning a Prior over Intent via Meta-Inverse Reinforcement Learning”\,
  arXiv preprint arXiv: 1805.12573 (2018) https://arxiv.org/abs/1805.12573
 \n\n
LOCATION:φcafe 東京都文京区本郷5丁目24-5　角川本郷ビル6F
URL:https://techplay.jp/event/688472?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR
