【未経験者歓迎】【初心者向け】Kaggleの事例を学ぼう!(モデルを作る前の予習) #3

2019/04/18(木)20:00 〜 22:00 開催
ブックマーク

イベント内容

内容概要

本勉強会は,
コンペティションサイトであるKaggleの事例を皆で読み、
理解を深めることまでを目的としています。
具体的には、カーネル(Kernels)に載っている他ユーザーが作成したモデルを対象とします。

そのため、モデルの作成、つまりコンペ(Competetion)への参加は
本勉強会の対象外とお考えください。
※こちらは別途企画することも考えております!

講義形式ではなく、
皆でワイワイやりながら事例を読むことで、
つまづくことなく皆でモデルの理解を深めていきたいと考えております。

Kaggleのアカウントをまだお持ちで無い方は、事前に作成いただけると助かります。
※ページ最下部にアカウント作成方法へのリンクを貼っています。難しくないのでご心配なく!

また、Kaggleが英語であることに抵抗がある方もいらっしゃるかもしれませんので、
重要な英単語の和訳(随時更新中)をnoteにアップしております。
※ページ最下部にリンクを貼っています!

第3回は、第1回・第2回に続きタイタニックの生存予測のデータを取り扱う予定です。
【第1回】カーネルを読む前に、日本語でのタイタニックの記事(最下部参照)を読みながら、予測結果の投稿までの流れを抑えました。
【第2回】同記事を読みながら、各自でPython環境にてモデル作成を行いました。また、決定木の可視化もあわせて行いました。

第3回は、決定木を作成するところのロジックを皆で勉強したいと思います。
主催者が読んでいる『戦略的データサイエンス入門』に記載されている説明をベースに勉強できればと思います。
※書籍のリンクは最下部に貼ってあります!

前提知識としては、
機械学習の全くの初心者というよりは、
「はじめてのパターン認識」など教科書的なものを一通り読んだレベルを想定しておりますが、
最低限、機械学習やKaggleについてざっくり調べておいて頂ければ大丈夫です。
※ページ最下部で機械学習の概要を抑えるのに良い書籍を紹介しております!

お気軽にご参加ください!
よろしくお願いいたします!

開催日程

4/18(木)
19:30〜20:00:受付&コミュニケーションツール(Slack)案内 
20:00〜20:10:自己紹介(主にイベント参加理由)
20:10〜20:15:趣旨の説明
20:15〜21:15:皆で読み込み(適宜休憩)
21:15~21:30:振り返り&次回進め方検討&参加してみての感想

※
進行次第で最長22時までは延長する可能性があります。
また、早く終わった場合でも22時までは会場を開けていますので、残って作業して頂いてもOKです。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F
※気楽に来れる感じの部屋です!

対象者

・モデル作成を始めたいが、まず事例を学びたい方
・既にモデル作成をしているが、そういえばカーネルはあまり見てなかった、という方
・1人だと学習が進まない方
・定期的な学習の予定を入れたい方
・大きな金額を学習に投資するのが気乗りしない方
・座学より自分で体験してモノにしたい方

当日のお持物

・PC
 ※プロジェクタでスクリーンに映す予定ですが、手元でも見れた方が捗ると思います。
・ご自身が勉強に使っているもの
 ※書籍など

事前にお願いしたいこと

・Python環境構築
 ※特に環境の指定はありませんが、主催者がJupyter Notebookを使っており、同じ環境の方がコード共有がスムーズかもしれません。
 ※当日、特に手を動かさなくても良いという方は必須ではありません。
・過去開催回のメモ確認
 ※最下部リンクをご確認ください。
・タイタニックコンペに関する確認
 ※最下部リンクのタイタニックコンペに関するページは、ざっと見ておいて頂けると理解が早まるかもしれません。

費用

・1,000円(会場代)

※ 領収書発行の際の参加費は法人参加と見なし、一律2,000円とさせていただきます。

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては、
基本的に行わないようにお願いいたします。
体調不良、職務都合、ご家庭の事情などどうしてものケースは、
下記問い合わせ先までご連絡いただけますと嬉しいです。
(connpass上でのキャンセルはNGとします)

上記を守って頂けない方に関しては、
以後の参加をお断りさせていただきますので、
その点だけ予めご了承ください。

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。

問い合わせ先:
pilovoliq@gmail.com
※主催者のプロフィール・経歴等が気になる方は、最下部のリンクをご確認くださいませ。
(あまり大したことは書いておりませんが。。。)

関連リンク

主催者・過去のイベントについて

◆主催者について(Facebook)
here
↓↓↓4/15追記↓↓↓ ◆本勉強会で作成しているJupyterNotebookファイル(Pythonコード)
here
 ※2019/4/4時点
↑↑↑4/15追記↑↑↑ ◆第1回でやったこと(by主催者)
here
◆第2回でやったこと(by主催者)
here

Kaggle

◆Kaggleアカウント作成方法(by主催者)
here

データサイエンス

◆データサイエンス関連英単語の和訳(by主催者)
here

Python

◆Pythonメモ(by主催者)
here
◆Python環境構築に関する記事(by共同主催者)
here
◆Python環境構築トラブルシューティング(by共同主催者)
here
◆Pythonオンライン講座(主催者は受講中)
here

機械学習

◆機械学習の概要を抑えるための書籍
『データサイエンティスト養成読本 機械学習入門編』(主催者も読んでいる途中)
here
◆機械学習無料オンライン講座(主催者もやる予定)
here
◆決定木の説明が分かりやすかった記事
here
◆決定木の説明が分かりやすかった書籍
『戦略的データサイエンス入門』(主催者も読んでいる途中)
here
↓↓↓4/15追記↓↓↓ ◆決定木の内容を理解するためのメモ(by主催者)
here
 ※決定木の理解について主催者が作成しているメモです。第3回はこれを見ながら実施します。
↑↑↑4/15追記↑↑↑

Kaggleタイタニックコンペ

◆タイタニックコンペ(Kaggle内)
here
◆タイタニックコンペ参考記事(1)
【Kaggle初心者入門編】タイタニック号で生き残るのは誰?
here
 ※本記事を参考にモデル作成をしています。
◆タイタニックコンペ参考記事(2)
【Pythonで決定木 & Random Forest】タイタニックの生存者データを分析してみた
here
 ※本記事を参考に決定木の可視化行っています。
◆タイタニック号沈没事故(Wikipedia)
here
◆タイタニックDataset(学習用データ・テストデータ統合版)(主催者作成)
here

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント