【上級者も歓迎】ゼロから作るアンサンブル学習|OSSに学ぶ機械学習の実装 #2

イベント内容

内容概要

scikit-learnなどといったOSSを手本に機械学習ライブラリの実装方法を学ぼう
ということで企画させて頂きました。

題材としては,予備知識が少なくて済む決定木・Random Forestから出発しますが、
最終的には最近Kaggleで人気なXGBoost(eXtreme Gradient Boosting)やLightGBM
(Light Gradient Boosting Machine)などの中身の把握まで行きたいと考えております。

初回は、アルゴリズムの理解を兼ねつつNumPyベースでRandom Forestの実装を
行いましたが、第二回ではscikit-learnのRandomForestの実装の解説を通して
初回の実装と見比べる形とできればと思います。

※
内容は独立していますので、初回に参加していなくても理解できる内容となっています。
ページ内の参考のブログの内容がベースのため、そちらをご確認の上だとよりスムーズかと思います。

開催日程

4/25(木)
受付: 19:50〜20:00
講義:   20:00〜22:00

※
途中5分ほど休憩を設ける予定です。

初回アジェンダ

1. sklearnの読み辿り方(20分)

2. DecisionTreeClassifierの読解 (60分)
   2-1. 全体の概観
   2-2. _treeの解読

3. RandomForestClassifierの読解(40分)
    3-1. 学習・予測部分
    3-2. feature_importance

※
第三回では勾配ブースティングの解説・実装の理解から入り、
XGBoostもしくはLightGBMについても触れていきたいと思います。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

対象者

・普段からツリー系・アンサンブル系の手法を使うけど、中でどう動いているかも知りたい方
・機械学習の実装方法を学びたい方
・OSSの読み方を知りたい方

対象レベルとしては,はじめてのパターン認識の第11章(識別器の組み合わせによる性能強化)を読んだけどイマイチしっくり来ない位がちょうどいいかと思います。
https://lib-arts.hatenablog.com/archive/category/hajipata
↑はじめてのパターン認識の読解メモは上記にまとめていますので参考にしていただけたらと思います!!

講師プロフィール

名前:たみや@tatatatatamiya
早稲田大学で非線形物理・統計物理を,北海道大学で生物物理を研究し博士号を取得。
昨年4月より都内の受託データ分析ベンチャー企業に勤務。
ETLから時系列解析・画像処理まで,手広く携わる。

当日のお持物

PC(Python環境はご自身で予めご用意ください)

費用

3,000円

※
・領収書発行の際は事務手数料として追加1,000円のお支払いをよろしくお願いいたします

定員

8名(集まり具合に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を反映しません)

備考

https://tatamiya.hatenablog.com

↑上記が講師ブログになりますので、参考にしていただけたらと思います!!

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
(7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

類似しているイベント