Pythonによるスクレイピング入門
参加枠 | 申込形式 | 参加費 | 参加者 |
---|---|---|---|
前払い
|
先着順 |
2,500円
クレジットカード払い
|
7人 / 定員8人 |
2回目の参加
|
先着順 | 無料 |
3人
/ 定員1人 (キャンセル待ち2人)
|
イベント内容
Pythonによるスクレイピング入門
概要
スクレイピングの入門から最も簡単な文章の類似度判定のロジックを理解し、実装できるようになります。
スクレイピングとはWEB上のコンテンツから任意のデータを取り出す手法の一種です。
必要な情報を素早く的確に取り出すことのできるスクレイピングは非常に便利です。しかし、HTMLやCSSの基本的な知識を持ち合わせていないと独学での習得は少し壁が高いかもしれません。
当講座では、HTML,CSS,javascriptの役割についても触れながらスクレイピングの入門を行います。また、APIというサービス側であらかじめ用意されているツールを使ってデータを取得する方法やSeleniumを使ってブラウザを操作する方法について解説します。合わせて、スクレイピングをする上で気をつけなければいけない問題に触れます。(seleniumを使ったスクレイピング手法は、実演のみ)
当日は実戦形式で進めていきますので、Python3をインストールしたPCの持参をお願いいたします。
講座を通じて得られること
・htmlの構造を理解し、必要なデータを自在に抽出するスキル
・スクレイピングしたデータを整形する手法の習得
・JSON形式のデータの取り扱い方の習得
・APIを使って取得したデータの整形方法を習得
・Seleniumを使ったChromeの操作方法の理解
講座一覧のフローチャート
どの講座から受講したら良いのかわからないというような方は、下記のフローチャートを参考にしていただければと思います。
内容
・html,css,javascriptの役割の解説
・cssセレクタを使ったスクレイピング
・スクレイピングしたデータの整形
・csvファイルへの出力
・スクレイピングをする際の注意点
・APIを使用したJSON形式のスクレイピング
・SeleniumでのChromeの操作
※ 当日予告なく時間配分・内容が変更になる可能性がございます。
事前準備
Python3のインストールをお願いいたします。
また、以下のパッケージを当講座では利用します。当日までに動作確認をお願いいたします。
・beautifulsoup4
・requests
・pandas
Pythonのインストール、パッケージの導入方法についてご不明点あれば、可能な範囲で対応いたしますので、info@to-kei.netまでご連絡ください。
また、google chromeを使用してhtmlやcssについての説明を行います。インストールされていなくても受講にあたって支障はありませんが、あるとより深い理解ができるかと思います。
こんな人にオススメ
・Pythonのfor文,if文など基本的な文法を理解している方(文法に自信のない方はこちらの講座の受講後に当講座の受講をおすすめいたします。)
・自然言語処理の基礎を学びたい人
・WEBに関する知識は少ないが、スクレイピングに興味がある人
・スクレピングを使ってデータ処理をしたい人
・APIを使ってみたい人。
講師
吉川武文
東京大学大学院にて機械学習を用いた生物データ解析の研究を行う。学部では生物情報科学を専攻。生物から得られるビッグデータの解析や生物学における理論のシミュレーション、モデリングなどにも精通。東京大学理科二類最高点合格、日本生物学オリンピック金賞・本選一位などの受賞歴を持つ。
持ち物
・Python3の実行環境をインストール済みのPC(windows Mac)
※インストールでお困りの方はinfo@to-kei.netまでご連絡いただければ、可能な範囲で対応致します。
※講座では「jupyter notebook」を使います。同じ実行環境で受講したい方は、インストールをお勧めします。
領収書について
【Stripeで事前決済の方】
クレジットカード会社が発行する明細を領収書の代わりとしてご利用ください。当社より重複しての領収書発行は行なっておりません。
【当日払いの方】
講座後のアンケートにて、「領収書が必要」にチェックを入れるようにお願いいたします。領収書をメールにて送付させていただきます。
【Paypalの方】
決済処理後にPaypalから送付されるメール内容、またはPaypalの取引履歴から該当項目を確認の上、「詳細」をご覧ください。それらが領収書の代わりとなります。また、クレジットカード会社発行の利用明細書も領収書としてご利用いただけます。(当社より重複しての発行は行えません)
受付・入場時間
開始の15分前から
※なるべく5分前までにお入りください。
※途中参加も可能です。
お問い合わせ
・メールでのお問い合わせは、info@to-kei.net までご連絡ください。
・こちらで⇨LINE@からもお問い合わせいただけます。(推奨)
注意事項
・リクルーティング、勧誘、採用活動など、目的に沿わない行為につきまして、主催者が相応しくないと判断した場合は即刻退出処分とします。全員が気持ちよく過ごすことが出来るよう、ご協力をお願い致します。
・講座内で扱うコンテンツは全て「全人類がわかる統計学」に帰属しています。複製はご遠慮ください。
・個人ブログへの講義コンテンツの掲載はご遠慮ください。
・最小遂行人数は「3名」です。開催日の前日までにこの人数に達しない場合は中止となります。ただし、複数の媒体で募集を行っているので、本サイトの申込者数が最小遂行人数に達しない場合でも開催になる場合がございます。もし、中止が決定した場合はその時点で登録しているメールアドレスにご連絡させていただきます。
全人類がわかる統計学とは
統計学の学習サイト、全人類がわかる統計学を運営、管理している団体です。統計学とその関連分野について、出来るだけわかりやすく多くの人々に届けるということを目指して活動しています。
参加費のお支払いについて
ご利用可能なクレジットカードをご用意いただき、お支払い手続きを行ってください。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。