BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:ディープラーニング強化学習 on Javascript その
 ２ + deeplearn.js + α
X-WR-CALNAME:ディープラーニング強化学習 on Javascript その
 ２ + deeplearn.js + α
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:627348@techplay.jp
SUMMARY:ディープラーニング強化学習 on Javascript その２ + d
 eeplearn.js + α
DTSTART;TZID=Asia/Tokyo:20170824T183000
DTEND;TZID=Asia/Tokyo:20170824T203000
DTSTAMP:20260421T035624Z
CREATED:20170708T160016Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/62734
 8?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\nTD学習の一
 つであるQ学習をディープラーニングで行う第２回目。
 \n前回6/30は基本的な理論とベルマン方程式を使った報
 酬期待値誤差のバックプロパゲーションについて学び
 ました。\n今回は前回の様子から、まずはjavascriptへの
 実装方法の基本的な方法からスタートし、\n今回使用
 するのはConvNetJSというjavascriptベースのディープラーニ
 ングフレームワーク。\nそれにDQNを実装したJSファイル
 と、実際に構築する設定値やネットワークの値をもう
 少し具体的に見ていきます。\n入力センサーは9方向*3
 種類の27のinputに対して、出力は進む方向の5つのoutput\n
 隠れ層は50の全結合+ReLUを２層です。\nlayer_defs.push({type:
 'input'\, out_sx:1\, out_sy:1\, out_depth:network_size})\;\nlayer_defs.pu
 sh({type:'fc'\, num_neurons: 50\, activation:'relu'})\;\nlayer_defs.push(
 {type:'fc'\, num_neurons: 50\, activation:'relu'})\;\nlayer_defs.push({ty
 pe:'regression'\, num_neurons:num_actions})\;\nJSの学習は10分くら
 いかかる＆CやGPUをきちんと使った場合に比べるとなか
 なか厳しいものがありますが、\n将来的な使用用途が
 わかりませんがなんとなく学びます。一応experience repla
 yなどの基本テクニックにも触れていこうと思います。
 \n時間があればオリジナルのマップやセンサー、オリ
 ジナルの制約条件やエージェントの数に関する考察な
 どを行いたいと思います。おそらくマルチエージェン
 トに関しては次回３回目以降になると思います。\n場
 所は未定ですが、千代田区丸の内もしくは本郷三丁目
 のラボカフェを予定しています。\n決まり次第連絡さ
 せていただきます。\n（17.8.11追記）時間配分を調整し
 ました。\n18:30-19:00 概論\n19:00-20:00 理論と実装\n20:00-20:3
 0 質疑と議論\nこのイベントの所属しているグループは
 ディープラーニングついてく会ですが、\nせっかくな
 ので欲張って一つ最新の論文を読みたいと思います。 
  \nReinforcement Learning with Deep Energy-Based Policies\nhttps://arxiv.
 org/abs/1702.08165  \nこちらはボルツマン分布からコスト関
 数ベースのDeep Energy-Basd Policiesというものに対して強化
 学習を行います。\n（17.8.18追記）最近さらにまさかのj
 avascriptベースのtensorflowサポートがgoogleから出ましたの
 で、そちらdeeplearn.jsを紹介します。\nhttps://pair-code.githu
 b.io/deeplearnjs/  \n（17.8.18追記）場所が決まりました。す
 みませんが、本郷が取れませんでしたので、東京駅八
 重洲地下街直結の日本酒類販売新八重洲口ビル B1Fのspa
 cee直営の会議室Bになります。以前も使いましたが多少
 レトロなビルです。場所がわかりづらいですが、住友
 生命ビルと繋がっていますので、八重洲地下街から入
 る場合には住友生命ビルになります。\n■場所\n東京都
 中央区八重洲２−２−１日本酒類販売新八重洲口ビル 
 \nhttps://goo.gl/maps/TTgSLmffrf82 \n東京駅からは「八重洲地下
 中央口」もしくは「八重洲中央口」が至近です。   \n
 ■地上玄関からの入館方法\n「北海道フーディスト」
 と書かれた看板があるビルです。\n看板に沿って小道
 に面した、ビル横の玄関(「日本酒類販売新八重洲口ビ
 ルディング」と書かれた玄関です)からお入りください
 。奥のエレベーターより地下1階にお上がりください。
  \n■八重洲地下街からの道順\n八重洲地下街マップ(http
 s://www.yaechika.com/floormap.php)をご参照ください。\nマップ
 内の3番出口「ミズノ」「すいしんたい乃屋」の間の扉
 から入っていただき、\n突き当たりを左に進んでいた
 だき、エレベーターを越えた右手にB会議室がございま
 す。\n※3番扉入って右にあるエレベーターは隣のビル
 のエレベーターなのでご注意ください。\n※PM8時以降
 と土日祝日は、ビル正面玄関よりお入り下さい。地下
 の入り口は閉まっています。  \n■Wi-Fiの利用方法（※
 無料設備のため通信の保証はいたしかねます）\n000_OneC
 oinSpace1\nPW: Gu7ERdiJ
LOCATION:東京都中央区八重洲２−２−１日本酒類販売新八
 重洲口ビル B1F 東京都中央区八重洲２−２−１日本酒
 類販売新八重洲口ビル B1F
URL:https://techplay.jp/event/627348?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR