学生の方はこちら

強化学習: 理論から実践へ

2024/05/21(火)19:00 〜 20:00 開催

ブックマーク

#スクラム, #数学, #機械学習

イベント内容

Math & Codingとは

数学とプログラミングのスキルを向上させたい方が集い学び合う場です。

難しい概念や技術も、シンプルな例で確認したりメンバーが対話することで本質的な理解を得られると考えます。

本グループは、そのようなことができるようなコミュニティとなることを目指します。

◆groupページ

https://www.facebook.com/groups/284004485439214/

◆過去のイベントスクラムサインのコミュニティーページ

https://scrumsign.com/community/

強化学習とは

強化学習(Reinforcement Learning, RL)とは、逐次的意思決定を取り扱うための、数理的な枠組みである。

意思決定をする主体である「エージェント」と、意思決定の場を与える「環境」との相互作用によって逐次的意思決定の過程をモデル化した上で、環境からエージェントに与えられる報酬を最大化するように意思決定ルール（方策）を学習させていくことで、最適な意思決定ルールを獲得でき、それにより状況に応じてどのように行動すべきかの指針を得ることができる。（強化学習から信頼できる意思決定へ　まえがきより）

本イベントで使用する教科書

強化学習から信頼できる意思決定へ (サイエンス社) https://amzn.asia/d/6ucjmXE

強化学習を勉強したことがない人は、以下の書籍をまず読むことをおすすめします
Reinforcement Learning: An Introduction https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf

この教科書を学ぶ意義

この教科書は、強化学習を実際にビジネスで応用することを目的として書かれた教科書である。

強化学習をビジネスで使用する際、試行錯誤の段階で、大きな損失を出すことや、重大なミスを犯してしまうリスクが、懸念点とされてきた。

この教科書では、それらの問題に対してうまく強化学習を適用する方法について書かれている。具体的には以下の三つである。

２章　環境をシミュレーター内に構築するオフライン学習

３章　リスクを考慮し、安定性に重点を置いた、リスク考慮型強化学習

４章　最適化問題の制約条件として、エージェントの行動に制約をつける安全性制約考慮型強化学習

これらの課題を解決し、強化学習をビジネスなどの現実問題に適用できるようにすることが、本イベントの目的、この教科書を学ぶ意義である。

進め方

基本的に強化学習から信頼できる意思決定へ(サイエンス社梶野洸他)を読み進めながら、事前に進行者が用意した資料を授業ノートがわりに進めていきます。

教科書の記述をよみ、定理やその証明の数式を丁寧に追って、ホワイトボードに書いて確認したりします。数式を言葉で言い換えたり、図を書いたりして、その数式が考えられた気持ちを理解していくことを大切にしています。

事前に進行者が用意した資料に、書き込みながら進めていきます。

主催者は議論の整理、進行をし、主催者がわからないところ、疑問を抱いているところは参加者の皆さんに質問したりもします。

集まったメンバー同士で重要となる定義、定理、命題について議論しています。

聴いているいるだけの参加の仕方もOKです。

準備

こちらのDiscord上で勉強会を行います。時間までに準備お願いします。

対象者

実践的な強化学習を学び、実際に業務に応用する基盤を学びたい方。

教科書をある程度読んできていただくことをおすすめします。

進行

尾崎勇介(株式会社スクラムサインインターン)

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

情報提供元ページ（connpass）へ

新規会員登録

このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。

※ ソーシャルアカウントで登録するとログインが簡単に行えます。

※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。

connpass

関連するイベント

【無料】「機械学習って結局何ができる？」今さら聞けないMLの基本と実践的な使い方をまとめて1時間で整理する講座

2026/01/17(土) 開催

【無料】「機械学習って結局何ができる？」今さら聞けないMLの基本と実践的な使い方をまとめて1時間で整理する講座

【無料】仮説検定からMLまで！全体像をつかみ分析初心者の“つまずきポイント”を解消「データサイエンス超入門」

2026/01/18(日) 開催

【無料】仮説検定からMLまで！全体像をつかみ分析初心者の“つまずきポイント”を解消「データサイエンス超入門」

最新のデータ統合基盤でAI活用定着化を進める、 Databricks データ・インテリジェンス・プラットフォーム活用の全体像を最短でつかむ！

2026/01/20(火) 開催

最新のデータ統合基盤でAI活用定着化を進める、 Databricks データ・インテリジェンス・プラットフォーム活用の全体像を最短でつかむ！

【無料】回帰・分類・深層学習の違いが直感的に理解できる！DX時代の常識MLの基本「機械学習超入門」初心者OK

2026/01/20(火) 開催

【無料】回帰・分類・深層学習の違いが直感的に理解できる！DX時代の常識MLの基本「機械学習超入門」初心者OK

【情報I】受験対策・お悩み相談会（親＆教員歓迎）2026年共通テストを振り返る

2026/01/24(土) 開催

【情報I】受験対策・お悩み相談会（親＆教員歓迎）2026年共通テストを振り返る

終　了

2024/05/21(火)

19:00〜 20:00

・オンライン

参加者: 32人 ／定員40人

情報提供元ページ（connpass）

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか？

無料でイベントをはじめる

タグからイベントをさがす

人工知能 UX Python Kubernetes Google Cloud 機械学習 IoT VR ビッグデータデータ分析

タグ一覧からさがす

関連動画

注目のイベント

「いつか移住したい」と言い続けているエンジニアの皆さん！【"稼げるまち"で全部アップデート】移住IT人材達が語る、自分らしい生き方の最適解【KITAKYUSHU Tech 2025 Day２再放送】

2026/01/30(金) 開催

【応募意志不問】NRIオンライン会社説明会＜事業・働く環境・キャリアについてとことんお伝えします＞

2026/01/16(金) 開催

Tableau ユーザー会

Snowflake ユーザー会

Canva Village

新規会員登録

このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。

※ ソーシャルアカウントで登録するとログインが簡単に行えます。

※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。