12月25日午後の部13:30-16:30データサイエンスの講習会Part6@LabCafe

イベント内容

【12月25日午後の部13:30-16:30データサイエンスの講習会Part6@LabCafe】
【概要】
今まで、扱ってこなかった、データハンドリング、欠損値への対応方法、計算の高速化、不均衡データへの対応と、Ensembling(Bagging, Boosting, Stacking(今回は2項分類と多項分類))を扱います。
【詳細】
・大きなデータを扱うための、readr,dplyr,tidyr,reshape2,data.tableパッケージ(HadleyWickham氏作)を用いたデータ操作。
・欠損値への対応
・並列化による計算の高速化
・Ensembling(bagging,boosting,stacking)

【タイムライン】
13:15- 開場
13:15-13:20 資料配布と各自自己紹介
13:20-13:25 Hadley Wickham氏紹介(5分)
13:25-14:00 データハンドリング系1(35分)
14:00-14:10 休憩
14:10-14:30 データハンドリング系2(20分)
14:30-15:00 欠損値処理系(30分)
15:00-15:30 Ensenbling入門(Bagging, Boosting, Stacking)(30分)
15:30-15:40 休憩
15:40-16:10 Stacking、 高速化、AWS関連、モデル保存方法(30分)
16:10-16:20 POSデータ集計・解析例紹介(10分)
16:20-16:30 質疑応答
16:30- 解散
【会場】
LabCafe @本郷
東京都文京区本郷4-1-3 明和本郷ビル7F
(本郷交番向かいの、ラーメン屋「本郷家」さんが1Fに入っているビル。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」     徒歩3分
http://lab-cafe.net/page/access
【日時】
2016年12月25日13:30-16:30

【お申込み方法】
Doorkeeperよりお願いします。
【料金】
学生無料(学生の方は受付で学生証をお見せください)
社会人3000円(お釣りのないようにご協力よろしくお願いします。以前Part6を行こうなされた方は無料です。受付にてお名前と受講日をお申し付けください。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.3.2 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.3.2 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。

【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.3.2.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)

【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。

・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

【今までの講習会の内容】
Part1: 機械学習入門とデータ可視化
Part2: 機械学習の実践と時系列データ解析入門
Part3: 統計、状態空間モデル、一般化線形モデル、Pythonでの機械学習入門 
Part4: Rのデータセットを用いた、データ可視化と解析演習
Part5: Caretパッケージ紹介、パラメータチューニング、XgboostでのKaggle参加
Part6: データハンドリング、欠損値への対応方法、計算の高速化、不均衡データへの対応、Ensembling

【お問い合わせ】
machine.learning.r@gmail.com

【講師紹介】
鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業

【主催】
東京大学機械学習勉強会
http://www.machine-learning-r.com/

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

類似しているイベント