BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:強化学習: 理論から実践へ #13
X-WR-CALNAME:強化学習: 理論から実践へ #13
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:954599@techplay.jp
SUMMARY:強化学習: 理論から実践へ #13
DTSTART;TZID=Asia/Tokyo:20240820T190000
DTEND;TZID=Asia/Tokyo:20240820T200000
DTSTAMP:20260407T034956Z
CREATED:20240814T140506Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/95459
 9?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\nMath & Codingと
 は\n数学とプログラミングのスキルを向上させたい方
 が集い学び合う場です。\n難しい概念や技術も、シン
 プルな例で確認したりメンバーが対話することで本質
 的な理解を得られると考えます。\n本グループは、そ
 のようなことができるようなコミュニティとなること
 を目指します。\n◆groupページ\nhttps://www.facebook.com/groups
 /284004485439214/\n◆過去のイベント スクラムサインのコ
 ミュニティーページ\nhttps://scrumsign.com/community/\n強化学
 習とは\n強化学習(Reinforcement Learning\, RL)とは、逐次的意
 思決定を取り扱うための、数理的な枠組みである。\n
 意思決定をする主体である「エージェント」と、意思
 決定の場を与える「環境」との相互作用によって逐次
 的意思決定の過程をモデル化した上で、環境からエー
 ジェントに与えられる報酬を最大化するように意思決
 定ルール（方策）を学習させていくことで、最適な意
 思決定ルールを獲得でき、それにより状況に応じてど
 のように行動すべきかの指針を得ることができる。（
 強化学習から信頼できる意思決定へ　まえがきより）\
 n本イベントで使用する教科書\n強化学習から信頼でき
 る意思決定へ (サイエンス社) https://amzn.asia/d/6ucjmXE\n強
 化学習を勉強したことがない人は、以下の書籍をまず
 読むことをおすすめします\nReinforcement Learning: An Introduc
 tion\nhttps://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBoo
 k2ndEd.pdf\nこの教科書を学ぶ意義\nこの教科書は、強化
 学習を実際にビジネスで応用することを目的として書
 かれた教科書である。\n強化学習をビジネスで使用す
 る際、試行錯誤の段階で、大きな損失を出すことや、
 重大なミスを犯してしまうリスクが、懸念点とされて
 きた。\nこの教科書では、それらの問題に対してうま
 く強化学習を適用する方法について書かれている。\n
 具体的には以下の三つである。\n２章　環境をシミュ
 レーター内に構築するオフライン学習\n３章　リスク
 を考慮し、安定性に重点を置いた、リスク考慮型強化
 学習\n４章　最適化問題の制約条件として、エージェ
 ントの行動に制約をつける安全性制約考慮型強化学習\
 nこれらの課題を解決し、強化学習をビジネスなどの現
 実問題に適用できるようにすることが、本イベントの
 目的、この教科書を学ぶ意義である。\n進め方\n基本的
 に強化学習から信頼できる意思決定へ(サイエンス社 
 梶野洸 他)を読み進めながら、事前に進行者が用意し
 た資料を授業ノートがわりに進めていきます。\n教科
 書の記述をよみ、定理やその証明の数式を丁寧に追っ
 て、ホワイトボードに書いて確認したりします。 数式
 を言葉で言い換えたり、図を書いたりして、その数式
 が考えられた気持ちを理解していくことを大切にして
 います。\n事前に進行者が用意した資料に、書き込み
 ながら進めていきます。\n主催者は議論の整理、進行
 をし、主催者がわからないところ、疑問を抱いている
 ところは参加者の皆さんに質問したりもします。\n集
 まったメンバー同士で重要となる定義、定理、命題に
 ついて議論しています。\n聴いているいるだけの参加
 の仕方もOKです。\n準備\nZoomで勉強会を行います。時間
 までにURLをお送りいたします。\n対象者\n実践的な強化
 学習を学び、実際に業務に応用する基盤を学びたい方
 。\n教科書をある程度読んできていただくことをおす
 すめします。\n進行\n尾崎 勇介(株式会社スクラムサイ
 ン インターン)
LOCATION:オンライン オンライン
URL:https://techplay.jp/event/954599?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR
