【オンライン開催】『Pythonでスラスラわかる　ベイズ推論「超」入門』読書会#1

2024/04/05(金)19:30 〜 20:30 開催

ブックマーク

#Python, #アルゴリズム, #テスト

イベント内容

初回は、第1章を取り上げます。

開催趣旨

本勉強会では下記の本を取り上げます。事前に予習し、コードを一通り動かしてから参加されることをオススメします。参加者同士の質問・意見交換やディスカッションをメインに進めていく予定です。

『Pythonでスラスラわかる　ベイズ推論「超」入門』（赤石雅典・著　須山敦志・監修, 講談社サイエンティフィク, 2023年11月）

※ 書籍はご自身で入手のうえ、ご参加ください。

参加対象者

統計学・機械学習の知識とPythonによる実装力を高め、業務や研究に活用した社会人・学生・研究者の方
Pythonの基礎的な文法やJupter Notebook、Google Colaboratoryの基本的な使い方を習得されている方

参加方法

Connpassの「参加者への情報」に記載のzoomリンクよりご参加ください。

勉強会の進め方

その日に取り扱う章を前もって各自ご自身で読み進めておいてください。
勉強会では、皆で書籍の内容を確認しながら、必要に応じてGoogle Colaboratory等で実際にコードを動かしていきます。
ポイントごとに立ち止まって疑問点をぶつけ合い、意見交換し、理解を深めていければと思います。

※ 一人が資料準備してきて一方的にレクチャーする形式ではなく、参加者同士インタラクティブにディスカッションしながら進めていきます。

目次（https://www.kspub.co.jp/book/detail/5337639.html）

【目次】

内容紹介

数学概念をプログラミングと対比させることで、スラスラと理解できる。
実務に即してPyMCプログラミングでベイズ推論を使いこなせるようになる。
最初の一冊として、データサイエンティストにおすすめ！

目次
第1章確率分布を理解する
1.1 ベイズ推論における確率分布の必要性
1.2 確率変数と確率分布
1.3 離散分布と連続分布
　1.3.1　離散分布
　1.3.2　連続分布
1.4 PyMCによる確率モデル定義とサンプリング
　1.4.1　インポート文
　1.4.2　確率モデル定義
　1.4.3　サンプリング
1.5 サンプリング結果分析
　1.5.1　Notebook UIを直接利用
　1.5.2　NumPy形式データを抽出
　1.5.3　ArviZによる分析
1.6 確率分布とPyMCプログラミングの関係
コラム　確率モデルとサンプル値（観測値）の関係を考える

第2章よく利用される確率分布
2.1 ベルヌーイ分布（pm.Bernoulliクラス）
　2.1.1　対応する事象
　2.1.2　確率分布を示す数式
　2.1.3　実装コード
2.2 二項分布（pm.Binomialクラス）
　2.2.1　対応する事象
　2.2.2　確率分布を示す数式
　2.2.3　実装コード
2.3 正規分布（pm.Normalクラス）
　2.3.1　対応する事象
　2.3.2　確率分布を示す数式
　2.3.3　実装コード
2.4 一様分布（pm.Uniformクラス）
　2.4.1　対応する事象
　2.4.2　確率分布を示す数式
　2.4.3　実装コード
2.5 ベータ分布（pm.Betaクラス）
　2.5.1　対応する事象
　2.5.2　確率分布を示す数式
　2.5.3　実装コード
　2.5.4　ベータ分布と一様分布の関係
2.6 半正規分布（pm.HalfNormalクラス）
　2.6.1　対応する事象
　2.6.2　確率分布を示す数式
　2.6.3　実装コード
コラム　HDIとCIの違い

第3章ベイズ推論とは
3.1 ベイズ推論利用の目的
3.2 問題設定
3.3 最尤推定による解法
3.4 ベイズ推論による解法
　3.4.1　事前分布の検討
　3.4.2　確率モデル定義
　3.4.3　サンプリング
　3.4.4　結果分析
3.5 ベイズ推論の精度を上げる方法
　3.5.1　観測値を増やす
　3.5.2　事前分布を工夫する
3.6 ベイズ推論の活用例
　3.6.1　ABテストの効果検証
　3.6.2　ベイズ回帰モデルによる効果検証
　3.6.3　IRT (Item Response Theory）によるテスト結果評価
コラム　事前分布と事後分布

第4章はじめてのベイズ推論実習
4.1 問題設定 (再掲)
4.2 最尤推定
4.3 ベイズ推論 (確率モデル定義）
4.4 ベイズ推論 (サンプリング）
4.5 ベイズ推論 (結果分析）
　4.5.1　plot_trace関数
　4.5.2　plot_posterior関数
　4.5.3　summary関数
4.6 ベイズ推論 (二項分布バージョン）
4.7 ベイズ推論 (試行回数を増やす）
4.8 ベイズ推論 (事前分布の変更）
4.9 ベータ分布で直接確率分布を求める
コラム　ArviZのFAQ

第5章ベイズ推論プログラミング
5.1 データ分布のベイズ推論
　5.1.1　問題設定
　5.1.2　データ準備
　5.1.3　確率モデル定義
　5.1.4　サンプリング
　5.1.5　結果分析
　5.1.6　ヒストグラムと正規分布関数の重ね描き
　5.1.7　少ないサンプル数でのベイズ推論
コラム　tauによる確率モデルの定義

5.2 線形回帰のベイズ推論
　5.2.1　問題設定
　5.2.2　データ準備
　5.2.3　確率モデル定義1
　5.2.4　確率モデル定義2
　5.2.5　サンプリングと結果分析
　5.2.6　散布図と回帰直線の重ね描き
　5.2.7　少ない観測値でのベイズ推論
コラム　target_acceptによるチューニング

5.3 階層ベイズモデル
　5.3.1　問題設定
　5.3.2　データ準備
　5.3.3　確率モデル定義
　5.3.4　サンプリングと結果分析
　5.3.5　散布図と回帰直線の重ね描き
コラム　PyMCの構成要素はどこまで細かく定義すべきか

5.4 潜在変数モデル
　5.4.1　問題設定
　5.4.2　データ準備
　5.4.3　確率モデル定義
　5.4.4　サンプリングと結果分析
　5.4.5　ヒストグラムと正規分布関数の重ね描き
　5.4.6　潜在変数の確率分布
コラム　潜在変数モデルにおけるベイズ推論のツボ

第6章ベイズ推論の業務活用事例
6.1 ABテストの効果検証
　6.1.1　問題設定
　6.1.2　確率モデル定義（鈴木さんの場合）
　6.1.3　サンプリングと結果分析
　6.1.4　山田さんの場合
　6.1.5　確率モデルを直接使った別解
コラム　ABテスト評価にPyMCのsample関数によるベイズ推論を使う必要はないのか

6.2 ベイズ回帰モデルによる効果検証
　6.2.1　問題設定
　6.2.2　データ読み込み
　6.2.3　データ確認
　6.2.4　データ加工
　6.2.5　確率モデル定義
　6.2.6　サンプリングと結果分析
　6.2.7　結果解釈
コラム　チュートリアルの確率モデル

6.3 IRT (Item Response Theory）によるテスト結果評価
　6.3.1　IRTとは
　6.3.2　問題設定
　6.3.3　データ読み込み
　6.3.4　データ加工
　6.3.5　確率モデル定義
　6.3.6　サンプリングと結果分析
　6.3.7　詳細分析
　6.3.8　偏差値と能力値の関係
　6.3.9　同じ偏差値の受験者間の能力値の違いの分析
コラム　変分推論法の利用