データサイエンティスト養成講座: 初級編

2015/02/14(土)13:30 〜 17:49 開催
ブックマーク
R

イベント内容

講師: 鈴木禎子(株式会社Joe’sクラウドコンピューティング代表取締役)

((第1部)) R言語の使い方の復習

((第2部)) 統計的検定と回帰分析

((第3部)) 実践演習

鈴木禎子以外に、女性インストラクター1名、データサイエンティスト1名(博士号取得者)の3名でのぞみます。

マーケティングや株価変動などの分析を行う前に、R言語と統計学をマスターする必要があります。それほど簡単ではなく、基礎が確実にできている方は少ないように思われます。

本講座では、
1. Rの基礎(numeric, logical, character, factor, matrix, array,dataframe,list, NULLの9クラスに限定)
2. 統計学の基礎(可視化、検定、回帰に限定)

当日は、検定の説明以外は、演習を中心に進めていきます。今回は、各自が実データをインターネットからダウンロードし、下記の問題に取り組みます。

1. 大相撲の番付と初場所の成績から、東と西の一方ばかりに強い力士が偏ったかどうかの統計的検定(平均値の差の検定)。
2. Jリーグ18チームの、各34試合の合計のシュート数と得点数と勝ち数の間で、シュート数と得点数は独立か、得点数と勝ち数は独立かのそれぞれの統計的検定(相関性の検定)
3. 那覇の2014年365日の最高気温から異常に暑かった日を検出する(異常値の検定)。
4. ドル-円とユーロ-円の各散布図と各単回帰、タイバーツ-円の散布図と両者からの重回帰。情報量基準AICの適用

理論や架空データだけでは、自信が育ちません。それを実践に移して自分のものになるものと思われます。

R言語については、何か一つでもプログラミング言語をやったことがあれば、心配はいらないものと思われます。本講座では、R言語の経験を仮定しません。セミナーより前に、オンラインで学習を進めていただきます。1. 基本概念, 2. ベクトル, 3. 行列配列リスト, 4. 関数とプログラミング, 5. データフレーム, 6. グラフィックスの6単元からなります。

http://joe.lms.ac/

にありますが、このスライドを用いて音声で説明し、演習問題を(オンラインで)提出して頂いて、講師が採点してコメントします。そのシステム内でも質問できますが、当日ももちろん質問できます。

鈴木禎子: 2002年からレンタルサーバーの株式会社Joe’sウェブホスティング(現在のJoe’sクラウドコンピューティング)を立上げ、通算で30,000ユーザにサービスを提供している。このほか、Joe’sビジネスセンター、Joe’s SSL市場などの新規事業を立上げている。近年、ビッグデータ事業に着手している。

R言語や統計学の知識は仮定していませんが、当日までにノートPCにR言語をインストールしていただき、会場にそのノートをもってきていただく必要があります(簡単な実習があるため)。
下記より、簡単にインストールできます。
http://cse.niaes.affrc.go.jp/miwa/ja/R/setupReasy/

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。