スクレイピングハッカソン by Team AI 11/15(水)
イベント内容
===================================
こんにちは! Team AI代表 石井大輔です。
機械学習の活用において、有益なデータの取得は鍵ですよね!
オープンデータやKaggleも面白いデータが多いですが、価値あるデータほど成形されていない場合も多いので、Web上からAPIやスクレイピングで取ったり、買ってくることになります。
Team AIではこのスクレイピングをテーマにしたハッカソンを開催します。
www.team-ai.com (http://www.team-ai.com/)
=> 下記の記事を読みながら皆でチームを組んでスクレイピングにチャレンジします。
===================================
前提条件 スクレイピング、クローリングする時の注意点
NGなことはしないようにしましょうね!
http://docs.pyq.jp/column/crawler.html
WEBサイトをスクレイピングしてAPI化するimport.ioを使ってみた
https://qiita.com/dnd0513/items/5b41481877408c6eb71f
役に立つ記事(コーディング不要ツール) Crawly これお手軽でいいです。何の設定もなく、URLを入れると無料で一瞬でスクレイピングしてくれます。
設定がカスタマイズできないのが難点
http://crawly.diffbot.com/?ref=producthunt
Import.io import.ioのアプリケーション版でスクレイピングをやってみる
=> とてもオススメですが、無料期間すぎると月$299です
https://qiita.com/t-usausausa/items/67a04445dc447aa5d40f
その他ツール Alternative products to Import.io
https://www.producthunt.com/alternatives/import-io
Who are the competitors to import.io?
https://www.quora.com/Who-are-the-competitors-to-import-io
Google SpreadSheet SpreadSheetでスクレイピング。Importxml他、便利な関数9+1
https://qiita.com/ktmg/items/d53440c913e20f8bb34c
Google SpreadSheet のGAS(JavaScript)でスクレイピング(Webデータゲット)
https://qiita.com/standard-software/items/16214dc4e64d28952c2d
Google スプレッド シートでWebスクレイピング
https://qiita.com/nsakusaku/items/2c1ae8c6f6855db6bad0
役に立つ記事(コーディング必要) PythonとBeautiful Soupでスクレイピング
https://qiita.com/itkr/items/513318a9b5b92bd56185
Python Webスクレイピング 実践入門
https://qiita.com/Azunyan1111/items/9b3d16428d2bcc7c9406
PythonでWebスクレイピングする時の知見をまとめておく
http://vaaaaaanquish.hatenablog.com/entry/2017/06/25/202924
Webサイトをスクレイピングする時のちょっとしたコツ
https://qiita.com/h5y1m141@github/items/118571c94ca42d2daf6a
相席ラウンジ リアルタイムな女性来店数をRubyでスクレイピング
https://qiita.com/ts-3156/items/0d12869e00e7bbc07688
おうちカクテルで学ぶWebスクレイピング Ruby
https://qiita.com/iga_xx/items/1524d587dce329568ceb
役に立つ本 PythonによるWebスクレイピング
https://www.oreilly.co.jp/books/9784873117614/
===================================
Team AIでは日々AIの開発業務・AI業界の人材紹介業務を行っていますが、
この度AIの勉強会を主催することになりました。
社会人も学生も、みんなで集まってAIを自習しましょう!
教材を持ち込んでもくもく勉強してもいいし、
皆と話して情報交換していただいてもいいです。
===================================
場所について:
150-0042 東京都渋谷区宇田川町 36-17, ニューシブヤマンション 202号室
JR渋谷駅徒歩5分、東急ハンズ渋谷店から30秒
フレッシュネスバーガーとサイゼリヤの間の道を進むと左手に見える白いマンションです
道順写真はこちらから
TEL: 080-6306-2223
36-17 New Shibuya Mansion 202, Udagawa-cho Shibuya-ku Tokyo JAPAN zip150-0042
===================================
Contact:
Please contact dai@jenio.co or 08063062223
質問がある方や、迷子になったという方は、
dai@jenio.coにご連絡ください。
===================================
主催:
AI開発やAI転職のご相談はこちらまで
===================================
代表: 石井 大輔 経歴 株式会社ジェニオ代表取締役
1975年岡山県生まれ。
E-Commerceを中心としたWeb開発と成長戦略の専門家。
京都大学卒業後、1998年伊藤忠商事に入社し繊維カンパニーでPaulSmith等を担当。
ロンドン、ミラノでの駐在を経て、2011年ジェニオを創業。
ファッション通販BUYMAの海外事業開発を受注。
2015年、シリコンバレーの起業家育成組織OneTractionの指導のもと米国で事業推進。
2016年、人工知能開発案件に特化したクラウドソーシングサービスTeam AIを立ち上げる。
===================================
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。