Tableauデータサイエンス勉強会 (第1回 リラン)

「Tableauデータサイエンス勉強会」はTableau からデータ分析を始めてこれからデータサイエンスの世界に活躍の場を広げていきたい方と、既にデータサイエンス分野で活躍されていて、Tableauを使って分析プロセスを効率化、効果的に可視化表現したい方を繋ぐコミュニティ―です。データの可視化から始めてデータサイエンスを楽しみたい方、「DATA」をネタにボーダーを超えた異業種間交流したい方がワイワイ盛り上がれる勉強会です。 第1回目は、AI教育のトップリーダーである、株式会社キカガクの 一花 さんをゲストスピーカーとしてお招きし、AIってそもそもなんだ?機械学習とどうちがうんだ?という話から、データを取りまくエンジニアとして、今後どのようにAI、機械学習と向き合っていくかについてお話+ディスカッションしていきたいと思います。 当日参加者様からのライトニングトーク・告知タイムも設けておりますので、発表したい内容がある方は事務局まで(Slack、メールで)お知らせください。
2019-06-16 22:07 Tableau Developers & DataScientists Club 更新

イベント当日のスライド

【スライド1】Tableauデータサイエンス勉強会 Season#1 株式会社キカガク 今西航平さん
【スライド2】ROC charts by Tableau ヴァリューズ 黒岩和憲さん
【スライド3】Tableauから始める機械学習ーやってみようPython連携 Tableau Japan  岩橋 智宏さん

【スライド1】Tableauデータサイエンス勉強会 Season#1

株式会社キカガク 今西航平さん

【スライド2】ROC charts by Tableau

ヴァリューズ 黒岩和憲さん

【スライド3】Tableauから始める機械学習ーやってみようPython連携

Tableau Japan  岩橋 智宏さん

TableauとPythonの連携方法、TabpyClientからデプロイ済みのモデルを呼び、リアルタイム予測するデモを実施しました。

イベント会場の様子

  • Tableau Japan 岩橋 智宏さん Tableau から始める機械学習やってみよう Tableau + Python連携
  • キカガク今西さん AI、機械学習とは?
  • ヴァリューズ 黒岩さん  Tableauで描くROCグラフ
  • インテージテクノスフィア 久保田さん みんなでデータ活用の道のり~Tableau社内啓蒙はじめます~
  • 当日の様子。今回も大盛況でした。

イベント参加者のブログ記事

イベント主催者からのコメント

4/15にGinza Sixで開催されたTableau データサイエンス勉強会 第1回が定員100名のところ355人の応募で大反響。
参加できない方が多数でたため、場所をTech Play 渋谷(定員200名)に移して第1回のリランを開催いたしました。

参加者約150名
会場ではSli.doというシステムを使い参加者の皆さんから質問を集いながら人気のある質問に回答する形で実施。


●オープニング

Tableau社岩橋さんからオープニングトーク。
データサイエンスとは何かを説明。
Pythonだけでもできるけど、Tableau使うことで容易にできることがある。
今の時代生産性向上も重要なので、PythonではPythonでしかできないことをやりたい。

●Tableau + Python連携

今回は予測モデルを作る話。
予測モデルを開発するにあたり、重要な点は2点。

1点目に訓練データが必要です。知らない人も結構いるので注意。
2点目に何のための予測モデル化を意識すること。
訓練データ使ってモデルの精度だけあげても、目的を明確にしておかないと求める精度もわからない。
例えば、銀行の貸倒率は何も考えなくても88%あたる。その時に88%の精度でても全く意味がない。

Tabpyクライアントを利用してデプロイ済みの決定木予測モデルに対してリアルタイム予測をするデモを実施。

予測モデルを作るのはtableauではなくPythonを使ってみてね。(詳細はスライド参照)


●AI、機械学習とは? キカガク今西さん

AIの定義は人によって異なるため、AIについて話すときは定義を共有してから話したほうがよい。

機械学習には微分積分、線形代数、確率統計の3つが重要。
機械学習の勉強始めるときには上記の数学や統計の勉強もしっかりしてください。

機械学習は大きく2つのフェーズに分かれます。
①学習  学習データと正解データ→モデル作成
②推論  新しいデータ→モデル→予測値

具体的には
不良品検知、設備異常検知、スパム検知、商品分類
製品需要予測、物体検出、商品レコメンド、自動運転
といった事例があげられるが、世の中のPoCの成功事例は3%程度。
失敗事例は取り上げられることがないが、裏に山ほど眠っている。

これはAIにできることとできないことを認識していないから失敗している。
AIにできること:大量のデータを高速に処理、ルールベースでの処理
AIにできないこと:人間が見て(考えて)も判断がつかない事象、ノイズがたくさんあるデータ

こうしたことを意識して簡単にPoCしてみるなら便利なツールを使うのがよい。
Microsoft  Azure Machine Learning,
Google     Cloud Auto ML
Amazon     Amazon SageMaker

最後に:AIは手段で目的じゃない!

ちなみに、Udemy動画の無料クーポン配布くださいました。
今西さんありがとうございました!


●今西さん Q&Aセッション

理系でないけど、データサイエンスになりたい場合はどうしたらいい?
→文系でもできる。最初にとっかかりあれば参考書やWeb研修などでもなんでもいける。近くにメンターとかいるとなおよい。


TensorFlow, Keras, Chanier, PyTorchいろいろあるが、スタートはKerasがおすすめ!
Kerasは簡単がゆえに高度な修正ができない。使いこなせるようになればTensorFlowやるのがよい。
Chainerは日本製のためドキュメントが少ないのがネックである。


社内でAIを広げるにはどうしたらいい?
→正直難しい。上が納得しないといけない。そのためには社内で勉強会してレバレッジきかせるのがいいかも。


データあれば何でもできると思っている役員を説得するにはどうしたらいい?
→外部の人間(私)をよんでください。内部の人間のことを上はきかない。


●ライトニングトーク・告知セッション

Tableauで描くROCグラフ     株式会社ヴァリューズ 黒岩和憲さん

Tableauは2013年に使い始めた。
モデル性能の評価:混同行列、ROCグラフ
混同行列を判定する閾値を変更することで描けるグラフ
Tableauと性能評価の相性はよいのでやってみてね。


●みんなでデータ活用の道のり~Tableau社内啓蒙はじめます~ 株式会社インテージテクノスフィア  久保田郁亮(ふみあき)さん

機械学習を社内で取り組んでるがうまくスケールしない。
そこで、①データレイクの構築、②データ利用ルールの制定、③データ結合アプリの公開を実施

これで使ってくれるだろう!と思ったが、「 んなわけない!!!」

理想:データさえ公開すれば、自身で目的に向かって走り出す。
現実:活用事例がないと手が動かない。ツールの自由度もほしいけど、標準ツールほしい。

→Tableau Server公開した。Tableau Desktop用意した。
でも絶対無理だろうから、啓蒙活動開始。
自社データ教育コンテンツ作ったり、コミュニティとかいろいろやってく

 

今回も大盛況に終わりました。6/27には第2回も開催しますので、ご参加よろしくお願いします!

Facebookグループ「Tableauデータサイエンス勉強会」にて、スピーカーの方が発表された資料やそのほかもろもろの情報共有を行っておりますので、こちらにもぜひご参加ください。

https://www.facebook.com/groups/tableau.datascience/