Tableauデータサイエンス勉強会 (第1回 リラン)

2019/05/23(木)19:00 〜 21:00 開催
ブックマーク

スライド

【スライド1】Tableauデータサイエンス勉強会 Season#1

【スライド2】ROC charts by Tableau

【スライド3】Tableauから始める機械学習ーやってみようPython連携

画像

  • Tableau Japan 岩橋 智宏さん Tableau から始める機械学習やってみよう Tableau + Python連携
    Tableau Japan 岩橋 智宏さん Tableau から始める機械学習やってみよう Tableau + Python連携
  • キカガク今西さん AI、機械学習とは?
    キカガク今西さん AI、機械学習とは?
  • ヴァリューズ 黒岩さん 
Tableauで描くROCグラフ
    ヴァリューズ 黒岩さん  Tableauで描くROCグラフ
  • インテージテクノスフィア  久保田さん
みんなでデータ活用の道のり~Tableau社内啓蒙はじめます~
    インテージテクノスフィア 久保田さん みんなでデータ活用の道のり~Tableau社内啓蒙はじめます~
  • 当日の様子。今回も大盛況でした。
    当日の様子。今回も大盛況でした。

ブログ記事

コメント

4/15にGinza Sixで開催されたTableau データサイエンス勉強会 第1回が定員100名のところ355人の応募で大反響。
参加できない方が多数でたため、場所をTech Play 渋谷(定員200名)に移して第1回のリランを開催いたしました。

参加者約150名
会場ではSli.doというシステムを使い参加者の皆さんから質問を集いながら人気のある質問に回答する形で実施。


●オープニング

Tableau社岩橋さんからオープニングトーク。
データサイエンスとは何かを説明。
Pythonだけでもできるけど、Tableau使うことで容易にできることがある。
今の時代生産性向上も重要なので、PythonではPythonでしかできないことをやりたい。

●Tableau + Python連携

今回は予測モデルを作る話。
予測モデルを開発するにあたり、重要な点は2点。

1点目に訓練データが必要です。知らない人も結構いるので注意。
2点目に何のための予測モデル化を意識すること。
訓練データ使ってモデルの精度だけあげても、目的を明確にしておかないと求める精度もわからない。
例えば、銀行の貸倒率は何も考えなくても88%あたる。その時に88%の精度でても全く意味がない。

Tabpyクライアントを利用してデプロイ済みの決定木予測モデルに対してリアルタイム予測をするデモを実施。

予測モデルを作るのはtableauではなくPythonを使ってみてね。(詳細はスライド参照)


●AI、機械学習とは? キカガク今西さん

AIの定義は人によって異なるため、AIについて話すときは定義を共有してから話したほうがよい。

機械学習には微分積分、線形代数、確率統計の3つが重要。
機械学習の勉強始めるときには上記の数学や統計の勉強もしっかりしてください。

機械学習は大きく2つのフェーズに分かれます。
①学習  学習データと正解データ→モデル作成
②推論  新しいデータ→モデル→予測値

具体的には
不良品検知、設備異常検知、スパム検知、商品分類
製品需要予測、物体検出、商品レコメンド、自動運転
といった事例があげられるが、世の中のPoCの成功事例は3%程度。
失敗事例は取り上げられることがないが、裏に山ほど眠っている。

これはAIにできることとできないことを認識していないから失敗している。
AIにできること:大量のデータを高速に処理、ルールベースでの処理
AIにできないこと:人間が見て(考えて)も判断がつかない事象、ノイズがたくさんあるデータ

こうしたことを意識して簡単にPoCしてみるなら便利なツールを使うのがよい。
Microsoft  Azure Machine Learning,
Google     Cloud Auto ML
Amazon     Amazon SageMaker

最後に:AIは手段で目的じゃない!

ちなみに、Udemy動画の無料クーポン配布くださいました。
今西さんありがとうございました!


●今西さん Q&Aセッション

理系でないけど、データサイエンスになりたい場合はどうしたらいい?
→文系でもできる。最初にとっかかりあれば参考書やWeb研修などでもなんでもいける。近くにメンターとかいるとなおよい。


TensorFlow, Keras, Chanier, PyTorchいろいろあるが、スタートはKerasがおすすめ!
Kerasは簡単がゆえに高度な修正ができない。使いこなせるようになればTensorFlowやるのがよい。
Chainerは日本製のためドキュメントが少ないのがネックである。


社内でAIを広げるにはどうしたらいい?
→正直難しい。上が納得しないといけない。そのためには社内で勉強会してレバレッジきかせるのがいいかも。


データあれば何でもできると思っている役員を説得するにはどうしたらいい?
→外部の人間(私)をよんでください。内部の人間のことを上はきかない。


●ライトニングトーク・告知セッション

Tableauで描くROCグラフ     株式会社ヴァリューズ 黒岩和憲さん

Tableauは2013年に使い始めた。
モデル性能の評価:混同行列、ROCグラフ
混同行列を判定する閾値を変更することで描けるグラフ
Tableauと性能評価の相性はよいのでやってみてね。


●みんなでデータ活用の道のり~Tableau社内啓蒙はじめます~ 株式会社インテージテクノスフィア  久保田郁亮(ふみあき)さん

機械学習を社内で取り組んでるがうまくスケールしない。
そこで、①データレイクの構築、②データ利用ルールの制定、③データ結合アプリの公開を実施

これで使ってくれるだろう!と思ったが、「 んなわけない!!!」

理想:データさえ公開すれば、自身で目的に向かって走り出す。
現実:活用事例がないと手が動かない。ツールの自由度もほしいけど、標準ツールほしい。

→Tableau Server公開した。Tableau Desktop用意した。
でも絶対無理だろうから、啓蒙活動開始。
自社データ教育コンテンツ作ったり、コミュニティとかいろいろやってく

 

今回も大盛況に終わりました。6/27には第2回も開催しますので、ご参加よろしくお願いします!

Facebookグループ「Tableauデータサイエンス勉強会」にて、スピーカーの方が発表された資料やそのほかもろもろの情報共有を行っておりますので、こちらにもぜひご参加ください。

https://www.facebook.com/groups/tableau.datascience/