Rによるオープンデータ前処理勉強会(医療データ)

イベント内容

内容

Rを使った前処理の勉強会を行います。

テーマは実際にやってみたをテーマにしたいと思います。

@NorimitsuNishi1さん

NDBオープンデータのファイルを大量ダウンロードする

@MITTI1210

  • Rを使ってDPC データの前処理に挑戦!

扱うデータ

今回扱うデータはオープンデータを使います。

  • NDBオープンデータ
  • DPCデータ

内容について

これらのオープンデータは誰でも入手可能で、政策評価や経営分析、研究など色々活用できるデータなのですが、そのままではExcel, R, pythonで集計できる形にはなっていません。

また年度毎に病院の名前が変わったり、各列の呼び方が変わるなど、複数年でデータをつなげるにも工夫が必要です。

医療職やその学生は医療統計ソフトとしてRやSPSSなどを使うことはありますが、前処理としてRを使うことはまだ少ないようです。

実際に分析する場合は高額なDPCのソフトを用いたり、大学院で先輩から回ってくる処理された『秘伝のデータ』を使うなど聞くこともあります。

今回はRに慣れていない方にはすぐに使えるような内容ではありません。また自分も勉強中なのでより良い解法はあります。ただ今回の勉強会で使い方がわかるというより、Rを使ってデータをダウンロードしたり前処理する姿を実際に見ていただくことで「へ〜。このデータがこうやって変わるんだ!」という体感をしていただき、Rの可能性やRを勉強するモチベーションにしていただければ幸いです。

登壇者の @NorimitsuNishi1さんはudemyで多くのRのコースを持たれており、DPCデータ、レセプトデータや電子カルテデータの分析とレポーティング業務に過去従事経験があります。

対象

Rの技術的な内容に関しては改訂2版 Rユーザのための RStudio[実践]入門が参考になるレベルです。もし興味があるけどRの使い方がわからないという場合はこの本をお勧めします。

もし現職のエンジニアやデータサイエンティストの方が参加される場合は、技術的に新しいものはなく「医療データってこうなってるのね」程度の内容になりますことをご了承ください

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。