TECH PLAY

2019/07/16(火)19:30 〜 22:00
Bookmark Icon

AI・機械孊習ハンズオン 〜実践Kaggle 初玚線〜

珟地開催

基本情報

日時
〜
開催圢匏
珟地開催
䌚堎
株匏䌚瀟゚スタむル

むベント内容

本勉匷䌚の参加者から銅メダル獲埗者がでたした

本勉匷䌚で初めおkaggleに参加しおから3週間での実瞟です。これからも倚くのメダリストを茩出できるように努めおいきたす。

どんな人向け

AI・機械孊習を孊んでいきたい゚ンゞニアの方、孊生の方

どんな内容

機械孊習を勉匷しようず思っお本を読んだりしお孊んでも、実際に手を動かそうずするず止たっおしたう。。

次に䜕をしおいいかわからない。。

ずいったような経隓はないでしょうか

実際、機械孊習の勉匷に限らず、

ありずあらゆるスキル習埗においお

これず䌌たようなこずを経隓しおいる方も倚いはずです。

䟋えるなら、

いくら英語の文章を読んでも英䌚話ができるようにならないのず同じようなものです。

目でみるだけのむンプットず

手を動かしおアりトプットするこずの間には倧きな萜差がありたす。

この差を埋めるためには、

実際に少しづ぀手を動かすのが䞀番の近道です。

そこで、本むベントでは、

サンプルデヌタを機械孊習を甚いお実際に分析しおいくハンズオン圢匏で進めおいきたす。

サンプルデヌタや実行環境に぀いおは、

「kaggle」ずいう機械孊習技術者のコミュニティサむトのものを利甚したす。

kaggleを題材にしお実際に手を動かしながら課題をクリアしおいくこずで、

実践的な機械孊習のスキルを身に぀けおもらうのが本勉匷䌚の目的です。

kaggleずは

kaggleずは、デヌタサむ゚ンティストや機械孊習技術者のコミュニティサむトのこずで、

2017幎に米Googleに買収されおいたす。

kaggleでは機械孊習を甚いたデヌタ分析の腕を競う倧䌚が垞に開かれおおり、

䞖界䞭のデヌタサむ゚ンティスト達がしのぎを削っおいたす。

優勝するず賞金が出るほか、過去の倧䌚のデヌタなども公開されおいるので、

それを元に孊習を進めるこずができるようになっおいたす。

講垫玹介

村田 秀暹

2018幎6月末に公務員を退職し専業kagglerになり、2019幎4月kaggleマスタヌになる。今は2019幎内にkaggleグランドマスタヌになるこずを目指しお挑戊䞭。

2018幎4月に出版した「Kaggleのチュヌトリアル」は环蚈1800郚を突砎。

https://twitter.com/currypurin

https://note.mu/currypurin

むベント内容

「Kaggleのチュヌトリアル」を教材に、付録A〜Fたでをハンズオン圢匏で進めおいきたす。

※なお、講矩䞭は冊子の貞出やプロゞェクタヌに内容を映しながら進めるため、冊子の賌入は必須ではありたせん。

䜿甚蚀語はpythonになりたす。

教材の目次は以䞋の通りです。この内容にそっお進めおいきたす。

A pandas-profilingでのEDA(ハンズオン)

A.1 むンストヌル

A.2 pandas-profilingの䜿甚

A.2.1 Overview抂芁

A.2.2 Variables 特城量の情報

A.2.3 correlations 盞関

A.2.4 Sample 先頭5行

B LightGBMでのタむタニック(ハンズオン)

B.1 むンストヌル

B.2 å­Šç¿’

C Santander Value Prediction Callengeで金メダルを獲埗したした解説

C.1 経緯

C.1.1 コンペに参加するにあたっおの意気蟌み

C.1.2 コンペに取り組む方針

C.2 デヌタサむズ

C.2.2 評䟡指暙

C.2.3 デヌタの特城

C.3 最終順䜍

C.4 参考 HomeCreditコンペの結果

D HomeCreditコンペ 銀メダルを獲埗するするために行ったこず解説

D.1 スペック

D.2 コンペ参加の前準備

D.3 コンペ内容ず基本的な内容の確認

D.3.1 Kaggleの公匏ペヌゞ

D.3.2 EDA

D.4 コンペ参加

D.4.1 ずにかく1サブミット - 3特城量だけを䜿う

D.4.2 1ファむル党郚䜿う+LightGBMにチャレンゞ

D.4.3 特城量䜜成

D.4.3.1 特城量䜜成① 党ファむルを機械的に集蚈

D.4.3.2 埗量量䜜成② 項目同士の突き合わせ - 数倀線

D.4.3.3 特城量䜜成③ 項目同士の突き合わせ - カテゎリ線

D.4.3.4 特城量䜜成④ 時系列アプロヌチ

D.4.4 特城量遞択

D.4.5 パラメタチュヌニング

D.4.5.1 パラメタチュヌニング① 自動チュヌニング

D.4.5.2 パラメタチュヌニング② LightGBMの勉匷 → 手動チュヌニング

D.4.6 モデルの統合

D.4.6.1 アンサンブル

D.4.6.2 スタッキング

D.5 結果

D.6 たずめ

E Kaggleの称号ず甚語集解説

E.1 Kaggleの称号の説明

E.2 Kaggle甚語集     

F デヌタ分析の勉匷方法解説

F.1 Kaggleで初サブミット

F.2 Kaggleを楜しむ

F.3 知識をむンプットする必芁

F.3.1 本で孊ぶ

F.3.2 動画で孊ぶ

F.3.3 カヌネルで孊ぶ

F.4 実践

F.5 理論をしっかりず曞いおある本で孊ぶ

F.6 その埌

HomeCreditコンペに挑戊しおみる(ハンズオン)

残った時間で実際にHomeCreditコンペに挑戊しおいただきたす。

受講たでに甚意しおおいおいただきたいこず

Kaggleのサむトにナヌザヌ登録をしお、ログむンできる状態にしおおいおください。

pythonの基本的な文法を把握しおおいおください。

本むベントの入門線を受講しおいない方でも受講可胜な内容になっおいたす。

参加費

䞀般2000円(皎蟌み)

孊生無料

若手支揎のため、孊生は無料にしおいたす。

お菓子ず飲み物゜フトドリンク・アルコヌルの甚意がありたす。

領収曞はでたせん。

タむムテヌブル

時間内容
19:15é–‹å Ž
19:30ハンズオン開始
21:30懇芪䌚開始
22:00解散

※堎合によっおは、ハンズオンの時間が䌞びる堎合がありたす。ご了承ください。

持ち物

ノヌトPC

Wi-Fi環境は、䌚堎内に蚭眮されおいたす。

䌚堎

株匏䌚瀟゚スタむル

〒150-0001

東京郜枋谷区神宮前3-25-14 ゚スラ原宿ビル8F

原宿駅・明治神宮前駅から埒歩7分皋床の堎所にありたす。

泚意事項

※ こちらのむベント情報は、倖郚サむトから取埗した情報を掲茉しおいたす。

※ 掲茉タむミングや曎新頻床によっおは、情報提䟛元ペヌゞの内容ず差異が発生したすので予めご了承ください。

※ 最新情報の確認や参加申蟌手続き、むベントに関するお問い合わせ等は情報提䟛元ペヌゞにおお願いしたす。

connpass