【データ】意外と知らない!!便利で利用可能なオープンデータの紹介
推奨オープンデータの紹介
本Awardではオープンデータ利用を推奨しております。
ただ「どこまでオープンデータとして取り扱っていいのか分からない」かと思います。
またオープンデータに触れたことがない方もいらっしゃると思います。
そこで本ページでは利用可能なオープンデータを紹介と、実際に利用方法等を紹介致します。
なお、2022年10月31日まで応募受付中です。ぜひご参加ください!
AWARDの詳細ページはこちら
https://techplay.jp/column/1604
1. 法人番号データベース
法人番号は、国税庁が発番・管理する番号です、日本ほぼすべての法人に付与されております。
※マイナンバーが個人に付与されるのと同じように、企業すべてに付与される番号でもあります。
また本番号に紐づいて、法人名や住所はすべて網羅されており、場合によって売上高や営業利益等も一発で分かります。また本情報は約500万社、すべて一般公開され、利用可能であることが明示されてます。
- (国税庁)法人番号公表サイト
https://www.houjin-bangou.nta.go.jp/
-(経産省)法人活動情報 データダウンロード
https://info.gbiz.go.jp/hojin/DownloadTop
ただデータ量が非常に膨大です。csvでダウンロードすると、扱いに困るケースもあるかと思います。
※関連レコード含めて1000万レコード超
その為、Tableauでも一部処理に苦労すると思います。
その際、truestarさん提供のPODB(Snowflake)でアクセスすると、大量のデータ処理は更に容易となります。
Twitterでつぶやくだけでユーザー利用できます。
下記使い方の紹介です。ぜひご利用ください。
https://www.youtube.com/playlist?list=PLhcmEuDJz4ds7fz4Sa2bL-STrwr8RIBKS
2. データカタログサイト(デジタル庁)
https://www.data.go.jp/
デジタル庁が提供するオープンデータです。横断的にオープンデータを利用できる為、地域や職業、業種別傾向等紐づけられます。
気になるデータがあればまずは調べてみてください。
3. RESAS(内閣府/経産省)
https://resas.go.jp/#/13/13101
分析するデータについて、まずは可視化してから中身を確認したい。
という方は、RESAS上で可視化して中身を確認できます。
例えば、下記は市区町村別の黒字企業比率を確認しました。どうやら都内よりも地方のほうが高いようです。
【出典】
総務省・経済産業省「経済センサス-活動調査」再編加工
【注記】
営業利益ベースの数値に基づき算出。
右下のグラフ表示の画面からダウンロードできます。
以上と注意点
他にも数多くのオープンデータはGoogle で調べると山ほど出てきます。
そのため、オープンデータを調べているうちに時間があっというまに経過してしまうことはよくあるケースです。
その為、「仮説」→「データ調査」→「分析結果を決める」の時間を計画立てることが非常に重要です。
また本AWARDで分析するにあたり、仮説をもとに「このデータって使って良いんだろうか」と悩むケースも数多くあると思います。
その際は、ぜひ運営側に「このデータ使って良いんですか?」とフォーム等で聞いてみてください!
その「データを探索する能力」はデータ分析者にとって自らな資質の一つです。ご連絡お待ちしております!