【オンライン開催】『Pythonではじめる異常検知入門』読書会#1
イベント内容
初回は、第1章、第2章を取り扱います。
開催趣旨
本勉強会では下記の本を取り上げます。事前に予習し、コードを一通り動かしてから参加されることをオススメします。参加者同士の質問・意見交換やディスカッションをメインに進めていく予定です。
『Pythonではじめる異常検知入門―基礎から実践まで―』(監修: 笛田 薫 氏(滋賀大学)、著:江崎 剛史 氏(滋賀大学)、李 鍾賛 氏(大阪経済法科大学), 科学情報出版, 2023年4月)
※ 書籍はご自身で入手のうえ、ご参加ください。
参加対象者
- 統計学・機械学習の知識とPythonによる実装力を高め、業務や研究に活用した社会人・学生・研究者の方
- Pythonの基礎的な文法やJupter Notebook、Google Colaboratoryの基本的な使い方を習得されている方
参加方法
Connpassの「参加者への情報」に記載のzoomリンクよりご参加ください。
勉強会の進め方
- その日に取り扱う章を前もって各自ご自身で読み進めておいてください。
- 勉強会では、皆で書籍の内容を確認しながら、必要に応じてGoogle Colaboratory等で実際にコードを動かしていきます。
- ポイントごとに立ち止まって疑問点をぶつけ合い、意見交換し、理解を深めていければと思います。
※ 一人が資料準備してきて一方的にレクチャーする形式ではなく、参加者同士インタラクティブにディスカッションしながら進めていきます。
目次(https://www.asakura.co.jp/detail.php?book_code=25047)
【目次】
第Ⅰ部 異常検知の準備
第1章 イントロダクション
1-1 異常検知とは何か
1-2 各章のつながり
第2章 異常検知のデータサイエンス
2-1 得られたデータの見える化(可視化)
2-2 得られたデータの数式化:回帰モデル
2-2-1 回帰モデルの構築
2-2-2 モデルの当てはまりの良さ
2-3 交差検証法
2-4 次元圧縮:主成分分析
2-4-1 主成分の導出
2-4-2 寄与率と累積寄与率
2-4-3 主成分スコア
2-4-4 因子負荷量と主成分の解釈
2-5 ベイズの定理
2-5-1 事象の設定
2-5-2 事象の確率
2-5-3 条件付き確率
2-5-4 ベイズの定理
第3章 異常度と評価指数
3-1 データに基づいた異常検知
3-2 異常度:正常と異常を判別する客観的基準
3-2-1 異常度算出の例1:データ間の距離を参考に正常と異常を考える
3-2-2 異常度算出の例2:正規分布を仮定して正常と異常を考える
3-3 異常検知の性能評価
3-3-1 正常データに対する精度
3-3-2 異常データに対する精度
3-3-3 分岐精度とF値
3-3-4 ROC曲線の下部面積
3-4 この章で使用したPythonコード
第4章 距離に基づいた異常検知
4-1 はじめに
4-2 類似度(距離)
4-3 距離に基づく異常検知のアプローチ
4-3-1 全てのデータ点との距離
4-3-2 最近傍(Nearest Neighbor)からの距離
4-3-3 k近傍(Nearest Neighbor)からの平均距離
4-3-4 k最近傍までの距離の中央値
第Ⅱ部 データの特性でアプローチを決める
第5章 入出力の情報に基づくアプローチ
5-1 通常状態からの乖離に基づく検知:ホテリングT2
5-1-1 データが従う確率分布の仮定
5-1-2 異常度の算出
5-1-3 異常判別の閾値設定
5-2 過去の傾向からの乖離に基づく検知:k-近傍法
5-2-1 データが従う確率分布の仮定
5-2-2 異常度の算出
5-2-3 異常判別の閾値設定
5-3 特定の構造から外れたデータの検知:One-Class SVM
5-3-1 データを囲む最小の球を考える
5-3-2 異常度の定義
5-3-3 カーネルトリック
5-3-4 異常判別の閾値設定
5-4 この章で使用したPythonコード
第6章 時系列情報に基づくアプローチ
6-1 定常状態の時系列データの異常検知
6-1-1 前の時点との相関を調べる
6-1-2 異常度の算出
6-1-3 異常度判別の閾値設定
6-2 非定常状態の時系列データの異常検知
6-2-1 差分をとって定常状態とみなせる形に変換する
6-2-2 異常度の算出
6-2-3 異常度判別の閾値設定
6-3 この章で使用したPythonコード
第Ⅲ部 実践
第7章 異常検知の実践例
7-1 複数入力データの異常検知
7-1-1 通常状態からの乖離に基づく検知:ホテリングT2
7-1-2 特定の構造から外れたデータの検知:One-Class SV
7-1-3 補足:ホテリングT2とOne-Class SVMの違い
7-2 時系列データの異常検知
7-2-1 気温データの時系列解析
7-2-2 補足:時系列モデルのパラメータ推定
第8章 補足
8-1 Pythonのインストールと実行
8-1-1 Anacondaのインストール
8-1-2 Jupyter notebookを使ったインタラクティブ環境
8-1-3 簡単な計算
8-1-4 変数の型
8-1-5 データ構造
8-1-6 プログラムの基本(for文とif文)
8-1-7 データの可視化
8-1-8 ライブラリのインストール
8-2 分岐ルールを作るアプローチ(Isolation Forest)
8-3 異常検知の理解に有用な文献・サイト
8-3-1 統計の基礎知識に関する書籍
8-3-2 一般的な統計に関する書籍
8-3-3 さらに進んだ統計の学習のための書籍
8-3-4 機械学習に関する書籍
8-3-5 データの可視化に関する書籍
8-3-6 Pythonの使い方に関する書籍
8-3-7 異常検知に関する書籍・Webサイト
8-3-8 データを使ったビジネス課題の解決のヒントになる書籍
索引
参加者同士の質問・情報交換
Scribble Osaka Lab(SOL)のSlackワークスペースで、参加者同士の質問・情報共有用チャンネルを設けております。参加ご希望の方は、申込みフォームで招待メール送り先のEmailアドレスをお教えください。
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。