【オープン講座】AI・機械学習ハンズオン 〜実践Kaggle〜

2019/09/19(木)19:30 〜 22:00 開催
ブックマーク

イベント内容

本勉強会の参加者からkaggle expert1名、銅メダル獲得者3名がでました!

本勉強会で初めてkaggleに参加してから3週間で銅メダルを獲得し、その後kaggle expertになった者が1名でました。また、それ以外にも本講座でkaggleを初めてから銅メダル獲得した者が3名出ました。これからも多くのメダリストを輩出できるように努めていきます。

どんな人向け?

AI・機械学習を学んでいきたいエンジニアの方、学生の方

どんな内容?

機械学習を勉強しようと思って本を読んだりして学んでも、実際に手を動かそうとすると止まってしまう。。

次に何をしていいかわからない。。

といったような経験はないでしょうか?

実際、機械学習の勉強に限らず、

ありとあらゆるスキル習得において

これと似たようなことを経験している方も多いはずです。

例えるなら、

いくら英語の文章を読んでも英会話ができるようにならないのと同じようなものです。

目でみるだけのインプットと

手を動かしてアウトプットすることの間には大きな落差があります。

この差を埋めるためには、

実際に少しづつ手を動かすのが一番の近道です。

そこで、本イベントでは、

サンプルデータを機械学習を用いて実際に分析していくハンズオン形式で進めていきます。

サンプルデータや実行環境については、

kaggle」という機械学習技術者のコミュニティサイトのものを利用します。

kaggleを題材にして実際に手を動かしながら課題をクリアしていくことで、

実践的な機械学習のスキルを身につけてもらうのが本勉強会の目的です。

kaggleとは

kaggleとは、データサイエンティストや機械学習技術者のコミュニティサイトのことで、

2017年に米Googleに買収されています。

kaggleでは機械学習を用いたデータ分析の腕を競う大会が常に開かれており、

世界中のデータサイエンティスト達がしのぎを削っています。

優勝すると賞金が出るほか、過去の大会のデータなども公開されているので、

それを元に学習を進めることができるようになっています。

講師紹介

村田 秀樹

2018年6月末に公務員を退職し専業kagglerになり、2019年4月kaggleマスターになる。今は2019年内にkaggleグランドマスターになることを目指して挑戦中。

2018年4月に出版した「Kaggleのチュートリアル」は累計1800部を突破。

https://twitter.com/currypurin

https://note.mu/currypurin

イベント内容

Kaggleのチュートリアル」を教材に、付録A〜Fまでをハンズオン形式で進めていきます。

(※なお、講義中は冊子の貸出やプロジェクターに内容を映しながら進めるため、冊子の購入は必須ではありません。)

使用言語はpythonになります。

教材の目次は以下の通りです。この内容にそって進めていきます。

A pandas-profilingでのEDA(ハンズオン)

A.1 インストール

A.2 pandas-profilingの使用

A.2.1 Overview(概要)

A.2.2 Variables (特徴量の情報)

A.2.3 correlations (相関)

A.2.4 Sample (先頭5行)

B LightGBMでのタイタニック(ハンズオン)

B.1 インストール

B.2 学習

C Santander Value Prediction Callengeで金メダルを獲得しました(解説)

C.1 経緯

C.1.1 コンペに参加するにあたっての意気込み

C.1.2 コンペに取り組む方針

C.2 データサイズ

C.2.2 評価指標

C.2.3 データの特徴

C.3 最終順位

C.4 参考 HomeCreditコンペの結果

D HomeCreditコンペ 銀メダルを獲得するするために行ったこと(解説)

D.1 スペック

D.2 コンペ参加の前準備

D.3 コンペ内容と基本的な内容の確認

D.3.1 Kaggleの公式ページ

D.3.2 EDA

D.4 コンペ参加

D.4.1 とにかく1サブミット - 3特徴量だけを使う

D.4.2 1ファイル全部使う+LightGBMにチャレンジ

D.4.3 特徴量作成

D.4.3.1 特徴量作成① 全ファイルを機械的に集計

D.4.3.2 得量量作成② 項目同士の突き合わせ - 数値編

D.4.3.3 特徴量作成③ 項目同士の突き合わせ - カテゴリ編

D.4.3.4 特徴量作成④ 時系列アプローチ

D.4.4 特徴量選択

D.4.5 パラメタチューニング

D.4.5.1 パラメタチューニング① 自動チューニング

D.4.5.2 パラメタチューニング② LightGBMの勉強 → 手動チューニング

D.4.6 モデルの統合

D.4.6.1 アンサンブル

D.4.6.2 スタッキング

D.5 結果

D.6 まとめ

E Kaggleの称号と用語集(解説)

E.1 Kaggleの称号の説明

E.2 Kaggle用語集     

F データ分析の勉強方法(解説)

F.1 Kaggleで初サブミット

F.2 Kaggleを楽しむ

F.3 知識をインプットする必要

F.3.1 本で学ぶ

F.3.2 動画で学ぶ

F.3.3 カーネルで学ぶ

F.4 実践

F.5 理論をしっかりと書いてある本で学ぶ

F.6 その後

HomeCreditコンペに挑戦してみる(ハンズオン)

残った時間で実際にHomeCreditコンペに挑戦していただきます。

受講までに用意しておいていただきたいこと

Kaggleのサイトにユーザー登録をして、ログインできる状態にしておいてください。

pythonの基本的な文法を把握しておいてください。

本イベントの入門編を受講していない方でも受講可能な内容になっています。

参加費

無料

お菓子と飲み物(ソフトドリンク・アルコール)の用意があります。

最少催行人数

6人以上

タイムテーブル

時間 内容
19:15 開場
19:30 ハンズオン開始
21:30 懇親会開始
22:00 解散

※場合によっては、ハンズオンの時間が伸びる場合があります。ご了承ください。

持ち物

ノートPC

Wi-Fi環境は、会場内に設置されています。

会場

株式会社エスタイル

〒150-0001

東京都渋谷区神宮前3-25-14 エスラ原宿ビル8F

原宿駅・明治神宮前駅から徒歩7分程度の場所にあります。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント