強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章強化学習前半」

2017/04/18(火)20:00 〜 22:00 開催

ブックマーク

#読書会, #ゲーム

イベント内容

発表形式を想定しています。
こちらの本を進めていく予定です。
発表してくださる方募集中！！

強化学習
https://www.morikita.co.jp/books/book/1990
強くなるロボティック・ゲームプレイヤーの作り方
https://book.mynavi.jp/ec/products/detail/id=52804
強化学習
https://www.morikita.co.jp/books/book/1990
http://neuro.bstu.by/ai/RL-3.pdf
オススメの本
https://www.morikita.co.jp/books/book/3034

ソース

Reinforcement Learning: An Introduction Python code for Sutton & Barto's book Reinforcement Learning: An Introduction (2nd Edition)
https://github.com/dennybritz/reinforcement-learning
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
A course in reinforcement learning in the wild
https://github.com/yandexdataschool/Practical_RL
techcircle_openai_handson
https://github.com/icoxfog417/techcircle_openai_handson

おまけ

some common TD Learning algorithms
https://github.com/chrodan/tdlearn

スケジュール

輪読本 https://book.mynavi.jp/ec/products/detail/id=52804

【4月】：強化学習
~~１週目：gym入門など●~~
~~２週目：~~
　　　　~~1章 “強くなる”ロボティック・ゲームプレイヤーを作るには~~
　　　　~~2章学習とは?~~
~~３週目：~~
　　　　~~3章強化学習●~~
　　　　　~~3.1 強化学習の背景~~
　　　　　~~3.2 強化学習の構成~~
　　　　　~~3.3 マルコフ決定過程~~
　　　　　~~3.4 最適政策関数~~
４週目：
　　　　3章強化学習●
　　　　　3.5 状態価値関数
　　　　　3.6 状態・行動価値関数
　　　　　3.7 動的計画法の問題点
【5月】：強化学習
１週目：
お休み
２週目：
　　　　4章　離散的な空間での学習●
　　　　　4.1　はじめに
　　　　　4.2　ルックアップテーブルで表される価値関数の例
　　　　　4.3　標本を抽出する
　　　　　4.4　モンテカルロ法
３週目：
　　　　4章　離散的な空間での学習
　　　　　4.5　価値関数近似における教師付き学習
　　　　　4.6　TD法
　　　　　4.7　Q学習
　　　　　4.8　三目並べ(Tic-Tac-Toe)の例
　　　　　4.9　実行例
４週目：
suttonに変える？
５週目：
【6月】：強化学習
１週目：
２週目：
３週目：
４週目：
【7月】：強化学習
１週目：
２週目：
３週目：
４週目：

以降〜
　　　　5章　連続的な空間での学習
　　　　　5.5　カーネルモデル
　　　　　5.6　線形モデルの最小二乗推定
　　　　　5.7　カーネルモデルの最小二乗推定
　　　　　5.8　アクロボットの例

5章　連続的な空間での学習
　　　　　5.1　はじめに
　　　　　5.2　台車の山登りゲーム
　　　　　5.3　価値関数の近似誤差
　　　　　5.4　価値関数のモデル

6章　政策を直接近似する
　　　　　6.1　はじめに
　　　　　6.2　政策勾配法
　　　　　6.3　最小分散ベースライン
　　　　　6.4　ガウスモデル政策モデル
　　　　6章　政策を直接近似する
　　　　　6.5　自然政策勾配法
　　　　　6.6　政策勾配の例
　　　　　6.7　4足ロボットへの実装

次の輪読テーマ募集！！

電子回路系

FPGAなど
Raspberry Piで学ぶ ROSロボット入門
https://www.amazon.co.jp/dp/4822239292/ref=pd_sim_14_64?_encoding=UTF8&psc=1&refRID=AY8SJWTTVSZ0RDZ8GBY4
https://github.com/ryuichiueda/raspimouse_book_info
Prototyping Lab――「作りながら考える」ためのArduino実践レシピ
https://www.oreilly.co.jp/books/9784873114538/

データサイエンス系

Python機械学習プログラミング達人データサイエンティストによる理論と実践
https://www.amazon.co.jp/Python%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0-%E9%81%94%E4%BA%BA%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%82%B9%E3%83%88%E3%81%AB%E3%82%88%E3%82%8B%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E8%B7%B5-impress-top-gear/dp/4844380605

数学系

プログラミングのための確率統計
https://estore.ohmsha.co.jp/titles/978427406775P
プログラミングのための線形代数
https://estore.ohmsha.co.jp/titles/978427406578P

暗号

暗号技術入門第3版
http://www.hyuki.com/cr/
Hacking: 美しき策謀第2版 ―脆弱性攻撃の理論と実際
https://www.amazon.co.jp/Hacking-%E7%BE%8E%E3%81%97%E3%81%8D%E7%AD%96%E8%AC%80-%E2%80%95%E8%84%86%E5%BC%B1%E6%80%A7%E6%94%BB%E6%92%83%E3%81%AE%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E9%9A%9B-Jon-Erickson/dp/4873115140
セキュリティコンテストチャレンジブック -CTFで学ぼう! 情報を守るための戦い方-
https://www.amazon.co.jp/%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%82%B3%E3%83%B3%E3%83%86%E3%82%B9%E3%83%88%E3%83%81%E3%83%A3%E3%83%AC%E3%83%B3%E3%82%B8%E3%83%96%E3%83%83%E3%82%AF-CTF%E3%81%A7%E5%AD%A6%E3%81%BC%E3%81%86-%E6%83%85%E5%A0%B1%E3%82%92%E5%AE%88%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AE%E6%88%A6%E3%81%84%E6%96%B9-%E7%A2%93%E4%BA%95-%E5%88%A9%E5%AE%A3/dp/4839956480/ref=sr_1_1?s=books&ie=UTF8&qid=1492399052&sr=1-1&keywords=CTF

web

flask
http://tatsu-zine.com/books/explore-flask/linkparts

実装をもっとしたい方はこちら

当日までに何かしら作ってくるミニハッカソン
発表のレベルは問いません。
https://aichatbot.connpass.com/event/

みんなでチャレンジしています。

House Price

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

General AI Challenge

https://general-ai-challenge.connpass.com/event/50541/

Self-Driving Car Challenge

https://www.udacity.com/didi-challenge

持ち物

実装をされる方はPC

対象

人工知能を１から始めたい方、考えてる方
人工知能に少し興味のあるプログラマ

ドキュメント

~~ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装~~
→終了
https://www.oreilly.co.jp/books/9784873117584/
~~kerasドキュメント~~
→終了
https://keras.io/ja/

参加費

1000円（会場費）

開催場所

コワーキングスペース秋葉原 Weeyble（ウィーブル)
http://weeyble.com/
東京都千代田区神田須田町２丁目１９−２３(野村第３ビル４階)
秋葉原駅電気街口または中央改札口より徒歩3分。都営新宿線岩本町駅徒歩3分、銀座線神田駅6番出口徒歩2分

その他

途中参加や途中退出は自由です。
電源、Wi-Fiはあります。
一緒に運営してくださる方募集してます。

グループ

https://www.facebook.com/groups/1515619948454253/
資料もこちらに貼る予定です。また質問などご自由にどうぞ。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

情報提供元ページ（connpass）へ

新規会員登録

このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。

※ ソーシャルアカウントで登録するとログインが簡単に行えます。

※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章強化学習前半」

イベント内容

ソース

おまけ

スケジュール

電子回路系

データサイエンス系

数学系

暗号

web

実装をもっとしたい方はこちら

みんなでチャレンジしています。

House Price

General AI Challenge

Self-Driving Car Challenge

持ち物

対象

ドキュメント

参加費

開催場所

その他

グループ

注意事項

新規会員登録

TECH PLAY でイベントをはじめよう

タグからイベントをさがす

関連動画

注目のイベント

新規会員登録

イベント内容

ソース

おまけ

スケジュール

電子回路系

データサイエンス系

数学系

暗号

web

実装をもっとしたい方はこちら

みんなでチャレンジしています。

House Price

General AI Challenge

Self-Driving Car Challenge

持ち物

対象

ドキュメント

参加費

開催場所

その他

グループ

注意事項

新規会員登録

関連するマガジン

Unityの機械学習ライブラリ【Unity ML-Agents】を解説

TECH PLAY でイベントをはじめよう

タグからイベントをさがす

関連動画

NTTデータのITスペシャリストが語る "推しの技"ー金融領域でのクラウドネイティ...

2023年度プログラミングコンテスト「ALGORI」決勝大会（2024年3月23日開催）

AWS Tech talk Night#2 ～動画配信／SaaS／Game／FinTech領域における最新アーキ...

注目のイベント

新規会員登録