機械学習 - データ前処理によく使われるライブラリPandas入門講座

参加枠申込形式参加費 参加者
当日支払い枠(会場支払い、現金・クレジットカード(Visa/Master/JCB))
先着順 16,200円
現金支払い
0人 / 定員3人
事前支払い
先着順 16,200円
事前支払い
0人 / 定員3人

イベント内容

データ前処理がよく使われるライブラリPandasの入門講座

Pythonのライブラリを学んで基礎から実戦へ

◆概要◆

機械学習を使ってデータ分析業務を行われる際に、生データを実際に分析できる段階のデータセットに整理するまでのデータ前処理段階では、およそプロジェクト全体の7割以上の時間に占められています。

今回の講座では、その7割の時間を節約ため、データ前処理の主流ライブラリーPandasを基礎から実戦までのスキルを教えます。
説明も練習もたくさん入れてますので、有意義な3時間を一緒に過ごしましょう!


機械学習でプロジェクトを分析する流れとして、
1.問題を明らかにする
2.データを取得する

ここまできたら、
3.「データ前処理」を行います。
取得したデータは大抵整理ができていないため、機械学習モデルがで使用できる段階まで整えるには、「データの前処理」が必要となります。この段階が全プロジェクト中で一番時間がかかり、かつ肝心な部分になります。そして全体の7割以上の時間はこの部分が占めています。

データ前処理では、データの修正(欠損値・外れ値・ノイズなど)を行います。
この部分をPythonで実施する場合、Python、およびPythonのライブラリー(Pandas、Numpy、Matplotlib、Seabornなど)の使い方を学ぶ必要があります。

その後、
4.「機械学習モデルに使えるデータセットの準備(通称:特徴エンジニアリング)」を行います。
機械学習のモデルが使えるデータセットがモデルごとに異なるので、必要な特徴もそれぞれ用意する必要があります。
この段階でもPython、及びPythonのライブラリー(Pandas, Numpy, Matplotlib, Seabornなど)を使います。

その後、
5.モデル選択
6.実施後のモデル制度の評価
などを行い、
7.本番稼働向けに実装してきます。

今回はこの分析の流れの3と4で登場するPandasの入門講座となります。

◆講座の予定◆

 1. Pandasのデータ構造
 2. 主要関数
 3. データ前処理
 4. 機械学習のモデルがすぐ使用できるデータセットの準備
  (通称:特徴エンジニアリング)
内容・順番は変更する場合があります。

◆このような方におススメです◆

- Pythonに興味がある方
- ライブラリ・Pandasの使い方がわからない方
- データアナリストになりたい方
- 機械学習やデータ分析に興味がある方
- 機械学習を本格的に勉強し始めたい方
- すでにプログラミングの経験者だが、さらに機械学習のスキルも身につけたい方
- データ前処理に苦戦している方

◆この講義を受講するとこんなことができるようになります、身につきます◆

- Pandasの基礎文法
- Pandasでデータ前処理の方法
- 機械学習モデルがすぐ使用できるデータセットの準備方法(通称:特徴エンジニアリング)

◆受講するにあたっての前提知識・前提条件◆

- Pythonの基礎文法、もしくは前提講座の「データサイエンティストとして不可欠なPython基礎文法」にご参加頂いた方(こちらの講座は必要な前提知識が一切なし)

◆もちもの◆

- プログラミングの実習があるためPCが必要です。
 一名に一台PC(windows)はこちらでご用意致しますが、
 もしご自身のPCが使い慣れているようでしたら、個人PCの持ち込みもOKです。
 ただし、Pythonが実行できる環境はご自身で整うようにお願いいたします。
 ※最新版のAnacondaをインストールしておいてください。
  Anacondaダウンロード先(ダウンロード)
  授業中に個人PC環境のサポートはできませんので、不安な方は教室のPCをご利用ください。

◆そのほか注意事項◆

コース自体が日本語ですが、質問などがございましたら、英語と中国語でも対応可能

参加費のお支払いについて

本イベントの参加費は、クレジットカードでの事前支払いとなります。
ご利用可能なクレジットカードをご用意いただき、お支払い手続きを行ってください。
本イベントは終了しました

類似しているイベント