TOP

Pythonによるスクレイピング入門

Pythonによるスクレイピング入門

参加枠申込種別参加費定員
当日現金払い
先着順 3,000円
当日現金支払い
20人 / 定員8人
(キャンセル待ち12人)
2回目の参加
先着順 無料 2人 / 定員1人
(キャンセル待ち1人)
前払い
先着順 2,500円
事前支払い
4人 / 定員4人

イベント内容

Pythonによるスクレイピング入門

概要

スクレイピングの入門から最も簡単な文章の類似度判定のロジックを理解し、実装できるようになります。

スクレイピングとはWEB上のコンテンツから任意のデータを取り出す手法の一種です。 必要な情報を素早く的確に取り出すことのできるスクレイピングは非常に便利です。しかし、HTMLやCSSの基本的な知識を持ち合わせていないと独学での習得は少し壁が高いかもしれません。
当講座では、HTML,CSS,javascriptの役割についても触れながらスクレイピングの入門を行います。また、APIというサービス側であらかじめ用意されているツールを使ってデータを取得する方法やSeleniumを使ってブラウザを操作する方法について解説します。合わせて、スクレイピングをする上で気をつけなければいけない問題に触れます。(seleniumを使ったスクレイピング手法は、実演のみ)

当日は実戦形式で進めていきますので、Python3をインストールしたPCの持参をお願いいたします。

講座を通じて得られること

・htmlの構造を理解し、必要なデータを自在に抽出するスキル
・スクレイピングしたデータを整形する手法の習得
・JSON形式のデータの取り扱い方の習得
・APIを使って取得したデータの整形方法を習得
・Seleniumを使ったChromeの操作方法の理解

講座一覧のフローチャート

どの講座から受講したら良いのかわからないというような方は、下記のフローチャートを参考にしていただければと思います。

Alt text

内容

・html,css,javascriptの役割の解説
・cssセレクタを使ったスクレイピング
・スクレイピングしたデータの整形
・csvファイルへの出力
・スクレイピングをする際の注意点
・APIを使用したJSON形式のスクレイピング
・SeleniumでのChromeの操作

※ 当日予告なく時間配分・内容が変更になる可能性がございます。

事前準備

Python3のインストールをお願いいたします。
また、以下のパッケージを当講座では利用します。当日までに動作確認をお願いいたします。

・beautifulsoup4
・requests
・pandas

Pythonのインストール、パッケージの導入方法についてご不明点あれば、可能な範囲で対応いたしますので、info@to-kei.netまでご連絡ください。

また、google chromeを使用してhtmlやcssについての説明を行います。インストールされていなくても受講にあたって支障はありませんが、あるとより深い理解ができるかと思います。

こんな人にオススメ

・Pythonのfor文,if文など基本的な文法を理解している方(文法に自信のない方はこちらの講座の受講後に当講座の受講をおすすめいたします。)
・自然言語処理の基礎を学びたい人
・WEBに関する知識は少ないが、スクレイピングに興味がある人
・スクレピングを使ってデータ処理をしたい人
・APIを使ってみたい人。

講師

大川遥平
全人類がわかる統計学の管理人。大学にて統計学を専攻。サイトでは確率分布の記事やサイトデザインを中心に担当。現在は、Web制作やPythonを用いたSEO対策用Webアプリケーションを構築するなどの活動をしている。また筑波大学大学院にて、自然言語処理の研究にも従事。

崔一鳴
全人類がわかる統計学の管理人。大学にて統計学を専攻。サイトではR、Python、仮説検定、統計の基礎の記事を中心に担当。現在は、PythonやRを使い、都内の私立大学医学部で統計解析の助手やDSコンペへの参加などの活動をしている。また東京工業大学大学院にて自然言語処理の研究にも従事。

阪中 裕子
お茶の水女子大学所属。CGアプリケーション、チャットボット等の実装経験あり。スクレイピングを使って航空機の航路データを収集し航路検索システムを作成。現在は、人工免疫アルゴリズムの分析と実装の研究に従事。

持ち物

・Python3の実行環境をインストール済みのPC(windows Mac)
※インストールでお困りの方はinfo@to-kei.netまでご連絡いただければ、可能な範囲で対応致します。

※講座では「jupyter notebook」を使います。同じ実行環境で受講したい方は、インストールをお勧めします。

参加費

当日現金払い
3000円(受付時にお支払いください)

二回目の参加の方
無料

※当講座は二回目のご参加に関しては無料で受け付けております。一回受けたが、途中参加だったために深い理解が出来なかった、もう一度受けて理解を深めたいという要望にお応えするためのものです。是非ご利用ください。

領収書について

当日払いの方
講座後のアンケートにて、「領収書が必要」にチェックを入れるようにお願いいたします。領収書をメールにて送付させていただきます。

受付・入場時間

開始の15分前から

※なるべく5分前までにお入りください。
※途中参加も可能です。

お問い合わせ

イベントに関するお問い合わせはinfo@to-kei.netまでご連絡ください。

注意事項

・リクルーティング、勧誘、採用活動など、目的に沿わない行為につきまして、主催者が相応しくないと判断した場合は即刻退出処分とします。全員が気持ちよく過ごすことが出来るよう、ご協力をお願い致します。
・講座内で扱うコンテンツは全て「全人類がわかる統計学」に帰属しています。複製はご遠慮ください。
・個人ブログへの講義コンテンツの掲載はご遠慮ください。

全人類がわかる統計学とは

統計学の学習サイト、全人類がわかる統計学を運営、管理している団体です。統計学とその関連分野について、出来るだけわかりやすく多くの人々に届けるということを目指して活動しています。

参加費のお支払いについて

本イベントの参加費は、クレジットカードでの事前支払いとなります。
ご利用可能なクレジットカードをご用意いただき、お支払い手続きを行ってください。
イベントに申し込む
2018/12/23(日)
19:00〜21:15
イベントに申し込む
【募集期間】
2018/12/02(日) 16:21 〜2018/12/23(日) 21:15
参加者
26人 / 定員13人
会場
秋葉原駅徒歩5分
東京都台東区台東1丁目11番4号 誠心Oビル 3階

グループ

主催

全人類がわかる統計学

フォロワー1098人
フォローする

管理者

開催予定イベント