ライバルは世界!Kaggleでデータサイエンス界をCarryせよ!

トレンド
ライバルは世界!Kaggleでデータサイエンス界をCarryせよ!

どうも、totokoです。

W.I.データサイエンス部にてずっとデータサイエンスやデータ分析、機械学習に関することを書いてきました。

そして、基本的には「データサイエンスは本当大事」というニュアンスの結論に帰結するわけです。

さらに僕は「なので、データサイエンス分野について勉強しましょう」と言っているわけです。

さて、このテの技術勉強大事という啓蒙活動の中で一つ懸念点があるのです。

「俺が鍛えたこのデータサイエンスの力をどこで発揮すればいいんだ!!」 ってやつです。

ようするに、せっかく勉強してもそれをアウトプットする機会がないわけですね。

もちろん、そこらへんのデータサイトをスクレイピングして解析~とかやってもいいのですが、それだと何が正しいのかわかりませんし、そもそも自分のやり方がベストなのかどうかはわかりません。

さらに言うと、「どうせやるならより実践に近いところでやってみたい!」という人もいるはずです。

というわけで、今回はデータサイエンティストと企業をつなぐプラットフォーム「Kaggle(カグル)」についてお話しましょう。

多分世界で一番データサイエンティストが集まる場所だと思います

そもそも、Kaggleってなによ?

という人向けに説明すると、「企業がコンペ形式で課題を提示し、賞金の提供と引き換えに最も精度の高い分析モデルを得ることができる。企業とデータサイエンティストをつなぐプラットフォーム」のことです。

どこにでもある企業と人をつなげるプラットフォームと違い、Kaggleにはコンペ形式の課題があるということです。

世界中のデータサイエンティストがそのコンペに対して、各々が作ったモデルをつかってデータ分析を行い、それが順位として評価され、ポイントを手に入れ、最終的にランキングとして反映されるのです。

彼らは予測の精度を競い合っています。空港のセキュリティに関する認識アルゴリズムだったり、販売者への価格提案アルゴリズムだったりコンペ課題は様々です。

ちなみに答えそのものはすでに用意されています。要するに僕らは「よっしゃこれが俺の予測結果だ!」となるデータを提出するわけです。

それが答えとどれだけ近いのか、その精度をスコアにして評価されるのです。

日夜様々な課題に対して、世界中のデータサイエンティスト達が己の腕だけで立ち向かっているのです。もちろん、ランキング上位を目指して。

企業は腕利きのデータサイエンティストをスカウト

このKaggleのコンペ課題で上位にランクインすると、出題元の企業からオファーが来るみたいです。

ようするに企業は採用にKaggleを用いているわけですね。

なんでまたそんなことをするのかというと、世界中をみてもデータサイエンティストの数はまだまだ少ないからですね。

これは僕がずっと様々なコラムで言っているとおりなので、いまさら何がどうのこうのと説明はしませんが……。

そうなると企業はただでさえ少ないデータサイエンティストから、腕利きのデータサイエンティストを雇いたいわけですね。

だってKaggleスコアで実力はわかっているんですから。

これは非常に有効で、よくある「雇ったけど大したことなかった……」という悲劇が起きづらいと思います。

世界は広い……だから燃える

どうしても狭いコミュニティの中だと自分がどれほどの実力を持っているのかがわかりにくいです。

もちろん都市部だと勉強会等があるので、コミュニティを増やせたりはできるでしょうが、地方だとそうはいきません。

ですが、Kaggleならその心配はありません。なんたって、ライバルは世界中のデータサイエンティストなんですから。

世界ですよ! 世界!

仮にKaggleのランキングで10位とかなったら、履歴書にも「Kaggle、世界ランク10位」って書けちゃいます!

さらに「世界ランキング10位」と言えるなんてかっこいいじゃないですか! こういうランキングとしてでてくるのはモチベーションがあがりますね。

それと同時に「自分の実力がどこまで通用するのか」その指標にもなるわけです。

上位ランカーとなりデータサイエンティスト界をCarryしよう!

ゲーム用語に「Carry」という言葉があります。これは簡単に言うと「試合を勝利へと運ぶ(Carry)人」のことです。

僕はこのKaggleのことを見た時、「これデータサイエンスのランクマッチじゃん」と思いました。

ついついゲーム的に考えちゃったわけですね。

先程も言いましたが、ランキングというわかりやすい指標で評価されるのは非常にいいです。

自分の実力に対して自信が持てますし。

おそらくKaggleランキングの上位にいる人は現実でもデータサイエンティストとして活躍している人かもしれません。

そして、彼らはもれなく、これからのデータ分析の世界を牽引する人となるはずです。

ですが、それはそれで面白くないですよね? どうせなら自分達がその位置になりたいですよね?

なのでKaggleで上位ランカーを目指しましょう! 

いきなりは難しいかもしれませんが、勉強を重ね、たくさんのコンペ課題に挑み、世界中の顔も知らないプレイヤーと切磋琢磨して、このデータサイエンス界全体のレベルアップを図りましょう!

もしかすると、次にこの世界を牽引するのはあなたかもしれないのですから……。

そして、よりよい世界へCarryしてください。

おすすめのコラム

データ分析はデータ整理が8割~ざっくりとしたデータクレンジング解説~

トレンド

どうも、totokoです。 さて今回は自分自身でもデータ分析を勉強していくなかで、改めて「あーそういうことなのね」...

データ分析はデータ整理が8割~ざっくりとしたデータクレンジング解説~