Rによるオープンデータ前処理勉強会(医療データ)
イベント内容
内容
Rを使った前処理の勉強会を行います。
テーマは実際にやってみたをテーマにしたいと思います。
@NorimitsuNishi1さん
NDBオープンデータのファイルを大量ダウンロードする
@MITTI1210
- Rを使ってDPC データの前処理に挑戦!
扱うデータ
今回扱うデータはオープンデータを使います。
- NDBオープンデータ
- DPCデータ
内容について
これらのオープンデータは誰でも入手可能で、政策評価や経営分析、研究など色々活用できるデータなのですが、そのままではExcel, R, pythonで集計できる形にはなっていません。
また年度毎に病院の名前が変わったり、各列の呼び方が変わるなど、複数年でデータをつなげるにも工夫が必要です。
医療職やその学生は医療統計ソフトとしてRやSPSSなどを使うことはありますが、前処理としてRを使うことはまだ少ないようです。
実際に分析する場合は高額なDPCのソフトを用いたり、大学院で先輩から回ってくる処理された『秘伝のデータ』を使うなど聞くこともあります。
今回はRに慣れていない方にはすぐに使えるような内容ではありません。また自分も勉強中なのでより良い解法はあります。ただ今回の勉強会で使い方がわかるというより、Rを使ってデータをダウンロードしたり前処理する姿を実際に見ていただくことで「へ〜。このデータがこうやって変わるんだ!」という体感をしていただき、Rの可能性やRを勉強するモチベーションにしていただければ幸いです。
登壇者の @NorimitsuNishi1さんはudemyで多くのRのコースを持たれており、DPCデータ、レセプトデータや電子カルテデータの分析とレポーティング業務に過去従事経験があります。
対象
Rの技術的な内容に関しては改訂2版 Rユーザのための RStudio[実践]入門が参考になるレベルです。もし興味があるけどRの使い方がわからないという場合はこの本をお勧めします。
もし現職のエンジニアやデータサイエンティストの方が参加される場合は、技術的に新しいものはなく「医療データってこうなってるのね」程度の内容になりますことをご了承ください
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。