【実務で使える】データ分析・機械学習実践講座

2019/04/07(日)19:00 〜 22:00 開催
ブックマーク

イベント内容

【実務で使える】データ分析・機械学習実践講座

日程(4月の毎週日曜日に開講)

講義日程
【Day1】4月 7日(日) 19:00~22:00
【Day2】4月 14日(日) 19:00~22:00
【Day3】4月 21日(日) 19:00~22:00
【Day4】4月 28日(日) 19:00~22:00

講座の動画を復習用に撮ります。もし参加できない日程がございましても、後ほど共有するようにいたしますので、ご安心ください。
※Python3を用いた実践を行いますので、Python3の基本文法は習得済みという前提で講義を進めます

概要

本講座では、実用に耐えるレベルでのデータ分析スキルを習得することを徹底的に考えて、カリキュラムを構成しました。一連の講座を通じて、データの前処理から、実用レベルでの機械学習の実装までを網羅的に学べます。また、各回の講義終了後には動画を共有いたしますので、聞き逃した箇所や理解が難しかった箇所の受講後のキャッチアップも簡単です。

本講座では、現場で活躍するデータサイエンティストから、実用的なデータ分析・機械学習のノウハウを体系的に学ぶことが出来ます。講義内では様々な実データを扱いながら、データ分析手法への理解を深めるとともに、データサイエンティストとしての素養を身につけていきます。

講座を通じて得られること

・機械学習手法を理解し、適切な場面で適切な手法を利用するスキル
・データを与えられた時に、自力で分析を実装するスキル
・機械学習全般に対する網羅的な理解

カリキュラム

第1回 機械学習の基礎① 回帰・教師なし学習

・ 回帰
 ・線形回帰分析・非線形回帰分析
 ・正則化(Lasso回帰・Ridge回帰)
・教師なし学習
 ・次元削減(PCA、SVD)
 ・クラスタリング(kMeans)
・通期課題の説明

第2回 機械学習の基礎② 分類

・ 決定木
・ランダムフォレスト
・ロジスティック回帰分析
・サポートベクターマシン
・k近傍法
・演習問題

第3回 実用レベルのモデリング

・より高精度なモデルを構築するために
 ・特徴量の可視化
 ・データのスケーリング
 ・クロスバリデーションによるハイパーパラメータ最適化
 ・過学習防止
・演習問題

第4回 ニューラルネットワークと深層学習

・ニューラルネットワークを利用するための前提知識や注意点
・前処理 ・単純なニューラルネットワーク
・CNN(畳み込みニューラルネットワーク)
・演習問題

※全日程において自宅課題が出題されます。
※予告なく内容が一部変更になる可能性がございます。

こんな人にオススメ

・実用に耐えるデータ分析スキルを習得し、仕事に活かしていきたい方
・Pythonの基礎文法の学習がひと段落し、次のステップに進みたいと考えている方
・Pythonによるデータ分析・機械学習を短期間で体系的に学びたい方

受講するにあたっての前提知識

【必須】
・Python3の基本的な文法(リスト,辞書,if文,for文,関数)とデータ分析ライブラリpandas,numpyの理解
理解に不安がある方は下記の講座を受講していただくか、ご自身で学習をお願いいたします。プログラムを書きながらの実戦形式で進めていきますので、プログラミング力はあればあるほど理解が促進されます。
【初心者歓迎】Python入門講座
Pythonデータ分析入門
Pythonデータ可視化・Numpy入門


【推奨】
・中学レベルの数学と一部統計学の知識があるとなおよし。
随所に数式が登場します。できるだけ噛み砕いて説明するようにいたしますが、数式への抵抗をなくして臨んだ方がより理解が促進されます。下記講座で統計学の基礎から中級レベルまでを網羅しておりますので、関心のある方は是非受講をご検討ください
レベル1:統計学超入門【超基礎編】(ゼロ〜統計検定3級合格レベルまで)
レベル2:統計学入門【確率変数・確率分布・ベイズ編】(統計検定2級合格レベル)
レベル3:統計学入門【推定・仮説検定編】(統計検定2級合格レベル)
レベル4:統計学入門【回帰・分割表解析・分散分析編】(統計検定2級合格レベル)

事前準備

Python3のインストールをお願いいたします。
また、以下のパッケージを当講座では利用します。当日までに動作確認をお願いいたします。
・sklearn
・numpy
・pandas
・matplotlib
・seaborn

Pythonのインストール、パッケージの導入方法についてご不明点あれば、可能な範囲で対応いたしますので、info@to-kei.netまでご連絡ください。

講師

柴田頼仁
慶應義塾大学理工学部にて統計学を専攻。スポーツと数字の結び付きに興味を抱き、統計学の道を志す。研究では時系列のニューラルネットワークを用いた野球の競技データ分析を行っている。

吉川武文
東京大学大学院にて機械学習を用いた生物データ解析の研究を行う。学部では生物情報科学を専攻。生物から得られるビッグデータの解析や生物学における理論のシミュレーション、モデリングなどにも精通。東京大学理科二類最高点合格、日本生物学オリンピック金賞・本選一位などの受賞歴を持つ。

渡邊 雅也
東京理科大学工学部情報工学科。大学にて金融工学、情報工学、統計学を専攻。研究室では,金融系時系列データの解析を基にエコノミストのアシスタントを行う。kaggleなどの機械学習コンペなどにも参加。

持ち物

・Python3の実行環境をインストール済みのPC(windows Mac)
※インストールでお困りの方はinfo@to-kei.netまでご連絡いただければ、可能な範囲で対応致します。

※講座では「jupyter notebook」を使います。同じ実行環境で受講したい方は、インストールをお勧めします。
※下記リンクでAnacondaをインストールすることで、インストールが可能です。
https://www.anaconda.com/download/

領収書について

【Stripeで事前決済の方】
クレジットカード会社が発行する明細を領収書の代わりとしてご利用ください。

【Paypalの方】
決済処理後にPaypalから送付されるメール内容、またはPaypalの取引履歴から該当項目を確認の上、「詳細」をご覧ください。それらが領収書の代わりとなります。また、クレジットカード会社発行の利用明細書も領収書としてご利用いただけます。

【別途領収書発行が必要な方】
別途発行手数料として1000円頂きます。必要な方はinfo@to-kei.netまでご連絡ください。領収書発行手数料と受講料金を合算した金額で発行いたします。

受付・入場時間

開始の15分前から

※なるべく5分前までにお入りください。
※途中参加も可能です。

お問い合わせ

イベントに関するお問い合わせは

info@to-kei.net
までご連絡ください。

講座の詳細に関する質問なども受け付けております。

注意事項

・講座内で扱うコンテンツは全て「全人類がわかる統計学」に帰属しています。複製はご遠慮ください。
・個人ブログへの講義コンテンツの掲載はご遠慮ください。
・最小遂行人数は「3名」です。開催日の前日までにこの人数に達しない場合は中止となります。ただし、複数の媒体で募集を行っているので、本サイトの申込者数が最小遂行人数に達しない場合でも開催になる場合がございます。もし、中止が決定した場合はその時点で「全額返金」し、登録しているメールアドレスにご連絡させていただきます。

全人類がわかる統計学とは

統計学の学習サイト、全人類がわかる統計学を運営、管理している団体です。統計学とその関連分野について、出来るだけわかりやすく多くの人々に届けるということを目指して活動しています。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント