強くなるロボティック・ゲームプレイヤーの作り方勉強会「1章2章」

2017/04/11(火)20:00 〜 22:00 開催
ブックマーク

イベント内容

発表形式を想定しています。
こちらの本を進めていく予定です。
発表してくださる方募集中!!

強くなるロボティック・ゲームプレイヤーの作り方
https://book.mynavi.jp/ec/products/detail/id=52804
強化学習
https://www.morikita.co.jp/books/book/1990
http://neuro.bstu.by/ai/RL-3.pdf
オススメの本
https://www.morikita.co.jp/books/book/3034

ソース

Reinforcement Learning: An Introduction Python code for Sutton & Barto's book Reinforcement Learning: An Introduction (2nd Edition)
https://github.com/dennybritz/reinforcement-learning
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
A course in reinforcement learning in the wild
https://github.com/yandexdataschool/Practical_RL
techcircle_openai_handson
https://github.com/icoxfog417/techcircle_openai_handson

おまけ

some common TD Learning algorithms
https://github.com/chrodan/tdlearn

スケジュール

輪読本 https://book.mynavi.jp/ec/products/detail/id=52804

【4月】:強化学習
1週目:gym入門など●
2週目:
    1章 “強くなる”ロボティック・ゲームプレイヤーを作るには
    2章 学習とは?
3週目:
    3章 強化学習●
     3.1 強化学習の背景
     3.2 強化学習の構成
     3.3 マルコフ決定過程
     3.4 最適政策関数
4週目:
    3章 強化学習●
     3.5 状態価値関数
     3.6 状態・行動価値関数
     3.7 動的計画法の問題点
【5月】:強化学習
1週目:
お休み
2週目:
    4章 離散的な空間での学習●
     4.1 はじめに
     4.2 ルックアップテーブルで表される価値関数の例
     4.3 標本を抽出する
     4.4 モンテカルロ法
3週目:
    4章 離散的な空間での学習
     4.5 価値関数近似における教師付き学習
     4.6 TD法
     4.7 Q学習
     4.8 三目並べ(Tic-Tac-Toe)の例
     4.9 実行例
4週目:
    5章 連続的な空間での学習
     5.1 はじめに
     5.2 台車の山登りゲーム
     5.3 価値関数の近似誤差
     5.4 価値関数のモデル
5週目:
    5章 連続的な空間での学習
     5.5 カーネルモデル
     5.6 線形モデルの最小二乗推定
     5.7 カーネルモデルの最小二乗推定
     5.8 アクロボットの例
【6月】:強化学習
1週目:
    6章 政策を直接近似する
     6.1 はじめに
     6.2 政策勾配法
     6.3 最小分散ベースライン
     6.4 ガウスモデル政策モデル
2週目:
    6章 政策を直接近似する
     6.5 自然政策勾配法
     6.6 政策勾配の例
     6.7 4足ロボットへの実装
強化学習 END
3週目:
4週目:

次の輪読テーマ募集!!
電子回路系
FPGAなど
ロボット系
https://www.amazon.co.jp/dp/4822239292/ref=pd_sim_14_64?_encoding=UTF8&psc=1&refRID=AY8SJWTTVSZ0RDZ8GBY4
https://www.oreilly.co.jp/books/9784873114538/
データサイエンス系
https://www.amazon.co.jp/Python%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0-%E9%81%94%E4%BA%BA%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%82%B9%E3%83%88%E3%81%AB%E3%82%88%E3%82%8B%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E8%B7%B5-impress-top-gear/dp/4844380605


実装をもっとしたい方はこちら

当日までに何かしら作ってくるミニハッカソン
発表のレベルは問いません。
https://aichatbot.connpass.com/event/

みんなでチャレンジしています。

House Price

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

General AI Challenge

https://general-ai-challenge.connpass.com/event/50541/

Self-Driving Car Challenge

https://www.udacity.com/didi-challenge

持ち物

実装をされる方はPC

対象

人工知能を1から始めたい方、考えてる方
人工知能に少し興味のあるプログラマ

ドキュメント

ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装
→終了
https://www.oreilly.co.jp/books/9784873117584/
kerasドキュメント
→終了
https://keras.io/ja/

参加費

1000円(会場費)

開催場所

コワーキングスペース秋葉原 Weeyble(ウィーブル)
http://weeyble.com/
東京都千代田区神田須田町2丁目19−23(野村第3ビル4階)
秋葉原駅電気街口または中央改札口より徒歩3分。 都営新宿線 岩本町駅徒歩3分、銀座線 神田駅6番出口徒歩2分


その他

途中参加や途中退出は自由です。
電源、Wi-Fiはあります。
一緒に運営してくださる方募集してます。


グループ

https://www.facebook.com/groups/1515619948454253/
資料もこちらに貼る予定です。また質問などご自由にどうぞ。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント