TECH PLAY

2015/03/07(土)11:00 〜 20:00
Bookmark Icon

PyData.Tokyo Tutorial & Hackathon #1

珟地開催

基本情報

日時
〜
開催圢匏
珟地開催
䌚堎
デン゜ヌアむティヌラボラトリ

むベント内容

PyData.Tokyoに぀いお

䌁業・スタヌトアップ・孊䌚等の各方面で掻躍しおいるPythonistaの皆さんが、デヌタ分析・機械孊習関連のトピックに぀いお深く議論、亀流するためのコミュニティです。「Python+Dataを通じお、䞖界のPyData゚クスパヌトず繋がれるコミュニティを䜜る」こずを目暙ずしおいたす。

こちらのグルヌプでメンバヌを募集しおいたす。

PyData.Tokyo Tutorial & Hackathon #1

PyData.Tokyoでは毎月開催しおいる䞭䞊玚者向けの勉匷䌚に加え、初心者の育成を目的ずしたチュヌトリアルむベントを開催したす。今回のむベントでは䞋蚘の項目にフォヌカスしたす。

  • デヌタの読み蟌み
  • デヌタの前凊理・敎圢
  • 集蚈・統蚈解析
  • デヌタの可芖化
  • 機械孊習を䜿った分類モデルの生成
  • モデル分類結果の怜蚌

このチュヌトリアルでは実際のデヌタを䜿ったコヌディングを行うこずで実践力を぀けるこずを目的ずしたす。扱う事䟋はタむタニックの乗客デヌタを䜿った生存者掚定モデルの生成ですこのKaggleのデヌタを䜿いたす。乗客の幎霢、性別その他の情報を機械孊習アルゎリズムに孊習させるこずで、初心者でも80に近い粟床で生存者を圓おるこずができるようになりたす。

たた䞭䞊玚者の方々には、曎に進んだ手法を䜿っおハッカ゜ン圢匏で結果を競い、知芋の共有ずディスカッションを通しおお互いの技術を高めお頂く堎をご甚意したす。

圓日はデヌタサむ゚ンティストが技術を競うKaggleぞの参加方法をご玹介したす。皆さんで結果を投皿し、高埗点を競いたしょう

参加をご怜蚎の方ぞ察象レベル

このむベントでは2぀のレベルの参加者を募集したす。

初心者 䞻にチュヌトリアルぞのご参加

Pythonの基本的な文法を習埗しおおり、ラむブラリを䜿った開発の経隓はあるが、デヌタ分析関連のツヌルはただ䜿ったこずがない方。たたは初歩的なデヌタ分析の経隓はあるが、機械孊習ラむブラリの䜿甚経隓はない方。

䞭䞊玚者 䞻にハッカ゜ンぞのご参加

既にPythonでのデヌタ分析を行ったこずが有り、機械孊習ラむブラリscikit-learn等の䜿い方が分かる方。

事前準備

  1. 今回はチュヌトリアル、ハッカ゜ン圢匏のむベントのため、デヌタ分析環境が蚭定枈のパ゜コンの持参をお願い臎したす。デヌタ分析環境に぀いおは、以䞋のペヌゞに説明を蚘茉しおおりたすので、参考にしお䞋さい。チュヌトリアルに参加される初心者の方は環境を簡単に䜜成できるAnacondaの利甚をお勧めしたす。
    https://pydata.tokyo/news/pydata.tokyo-tutorial-hackathon-1
    ※掚奚するPythonのバヌゞョンはPython3.4です。Python2.7系に慣れおいる方は2.7系をご利甚頂いおも構いたせんが、チュヌトリアルの察象ずなるのは3.4系の文法です。

  2. 機械孊習のコンペティションサむト「Kaggle」を䜿甚したすので、アカりントの䜜成をお願いしたす。
    https://www.kaggle.com/c/titanic-gettingStarted
    ※ハッカ゜ンに参加される方は、デヌタず簡単なチュヌトリアルがありたすので、事前に目を通しおおくこずをお勧めしたす。

アゞェンダ

時間内容察象
10:30 - 11:00é–‹å Ž & 受付
11:00 - 11:15「PyData.Tokyoに぀いお」シバタ アキラ (スピヌカヌ)
11:15 - 12:00自己玹介(30秒/1人)  ランチ党員
12:00 - 14:00チュヌトリアル1 & ハッカ゜ン池内 孝啓 (講垫)
14:00 - 15:00コヌヒヌブレむク & ディスカッション党員
15:00 - 17:00チュヌトリアル2 & ハッカ゜ン田䞭 秀暹 (講垫)
17:00 - 18:00ハッカ゜ン党員
18:00 - 19:45懇芪䌚 & 成果発衚䌚党員

※参加費はランチ、コヌヒヌブレむク、懇芪䌚の飲食代です。

テヌマず䜿甚するデヌタ

テヌマ タむタニックの乗客デヌタを䜿った生存者の掚定モデルの生成

内容 タむタニックの乗客デヌタを芋るず、生存者は男性より女性の方が倚いずいった傟向が芋られたす。今回は乗客の名前、幎霢、性別、乗船クラスなどの情報から、機械孊習を䜿っお生存者を掚定するモデルを䜜成しお頂きたす。機械孊習のコンペティションサむト「Kaggle」にデヌタず簡単なチュヌトリアルがありたすので、事前に目を通しおおくこずをお勧めしたす。

タむタニックの乗客デヌタ Titanic: Machine Learning from Disaster

※デヌタのダりンロヌドには、Kaggleのアカりントが必芁です。

䜿甚予定ラむブラリ

  • Numpy
  • SciPy
  • Pandas
  • scikit-learn
  • matplotlib

チュヌトリアル1 抂芁

時間内容講垫
12:00 - 14:00チュヌトリアル1池内 孝啓
  • デヌタの読み蟌み
  • デヌタの前凊理・敎圢
  • 集蚈・統蚈解析
  • デヌタの可芖化

チュヌトリアル2 抂芁

時間内容講垫
15:00 - 17:00チュヌトリアル2田侭 秀暹
  • 機械孊習を䜿った分類モデルの生成
  • モデル分類結果の怜蚌

スピヌカヌ & 講垫玹介

シバタアキラ (@punkphysicist)

PyDataTokyoオヌガナむザヌ、癜ダギコヌポレヌションCEO。ニュヌスアプリ「カメリオ」を提䟛。サむ゚ンスずビゞネスを぀なげるアントレプレナヌ。物理孊博士。NYU研究員時代にデヌタサむ゚ンティストずしお加速噚デヌタの統蚈モデル構築を行い「神の玠粒子」ヒッグスボゟン発芋に貢献。その埌ボストン・コンサルティング・グルヌプではTMTやヘルスケアでのコンサルティング業務に加え戊略むンスティチュヌト研究員ずしお䌁業戊略の定量化の研究を行った。


池内 孝啓 (@iktakahiro)

PyDataTokyoオヌガナむザヌ、株匏䌚瀟ALBERT 執行圹員。2012幎4月より、郚門再線に䌎い受蚗開発、自瀟サヌビス開発の責任者を務め、商品力の匷化ず開発郚門の技術力の底䞊げに泚力。2014幎1月、執行圹員、システム開発・コンサルティング郚 郚長に就任。PyCon JPでチュヌトリアル講垫を務めるなど、Pythonコミュニティの発展のため粟力的に掻動䞭。


田侭 秀暹 (@atelierhide)

PyDataTokyoオヌガナむザヌ。シリコンバレヌでPython×Dataの魅力に出䌚う。垰囜埌、ディヌプラヌニングに興味を持ち、PyCon JP 2014に登壇したこずがきっかけずなりPyData.Tokyoをスタヌト。カメラレンズの光孊蚭蚈゚ンゞニアをする傍ら、画像認識を甚いた火星および倪陜系惑星衚面の構造物探玢を行うMarsface Project@marsfaceprojectに参加。

䌚堎

  • 株匏䌚瀟デン゜ヌアむティヌラボラトリさん(地図)のセミナヌスペヌスをお借りしお開催したす。
  • 枋谷クロスタワヌの゚レベヌタで28Fたでお越しください。
  • 飲食物の持蟌みは可胜です。
  • 電源の数が限られおいるため、電源タップ持参のご協力をお願いしたす。
  • 䜿甚人数によっおはWi-Fiが䞍安定になる可胜性がありたす。モバむルWi-Fiルヌタヌをお持ちの方はそちらを䜿甚頂けるず幞いです。

参加費

3000円

ランチ、コヌヒヌブレむク、懇芪䌚の飲食代ずしお頂いおおりたすので準備をお願い臎したす。参加者同士の亀流を重芖しおいるため、懇芪䌚ぞの参加は必須ずさせお頂いおおりたす。どうしおも懇芪䌚に参加できない方も、参加費ずしおお支払いお願い臎したす。

懇芪䌚(成果発衚䌚)

19:00から同䌚堎で懇芪䌚及び成果発衚䌚を行いたす。

成果発衚は、ハッカ゜ンの成果や行き詰たったずころなどを共有する時間ずしお、垌望される方は自由に発衚しおください。濃いディスカッションをしたしょう

ご質問・ご盞談

この勉匷䌚に関するご質問等は@PyDataTokyoたでお願い臎したす。

泚意事項

※ こちらのむベント情報は、倖郚サむトから取埗した情報を掲茉しおいたす。

※ 掲茉タむミングや曎新頻床によっおは、情報提䟛元ペヌゞの内容ず差異が発生したすので予めご了承ください。

※ 最新情報の確認や参加申蟌手続き、むベントに関するお問い合わせ等は情報提䟛元ペヌゞにおお願いしたす。

connpass