【水曜お昼の雑談会】データサイエンスすいすい会 第11回「大規模データ分析基盤と自動機械学習(BigQuery + Matillion + ForecastFlow)」

2021/02/10(水)12:00 〜 13:00 開催
ブックマーク
参加枠申込形式参加費 参加者
参加者
先着順 無料 22人 / 定員50人

イベント内容

データサイエンスすいすい会

概要

データサイエンスに関する雑談を通して、すいすいデータサイエンスを推進できるような知見を貯めていくオンライン雑談会

GRIの分析官リーダ他が参加してテーマについてお話します
参加無料、お昼を食べながらお気軽にご参加ください

スケジュール

第11回 2021年2月10日(水)12:00~13:00 

隔週で開催予定

参加方法

時間になりましたら、下記ZoomURLよりご自由にご参加ください

https://zoom.us/j/96152836275

内容

大規模なデータを扱っている方にとって、特徴量エンジニアリングなどで苦労している方も多いと思います。今回のすいすい会では、そういう方のために、大規模データ分析基盤と自動機械学習連携の手順をお話します。具体例として、下記の3ツールを連携のご紹介いたします。

  • BigQuery: 大規模データを扱うためのデータベース(Googleクラウド)
  • Matillion: BigQueryのデータフローの可視化、ジョブ管理のしやすいELTツール(ETLではなく、extract-load-transformation)
  • ForecastFlow: 誰でも機械学習の予測ができる自動機械学習ツール

Matillionの良い所は、グラフィカルにデータ整形作業を記述できるだけなく、BigQuery側の処理スピードを活用して、データ整形の実行ができます。これにより、BigQueryからデータを抽出して特徴量を作らず、BigQueryの中で特徴量を作れるため、高速に特徴量を作成することができます。

    ナビゲーター

    古幡 征史 

    株式会社GRI 取締役
    Ph.D in Computer Science
    GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
    KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職

     

    参加対象

    ・データサイエンスに関心のある方

    参加費

    無料

    機械学習活用やデータサイエンスに関する情報共有コミュニティ

    自由にご参加いただけるSlackを用意しています
    実践的に機械学習を活用するための議論やノウハウの共有を目的としています
    すいすい会の内容についても活発に議論できればと思います
    Slackはこちら

    過去のすいすい会

    第1回「ビジネスでAIを上手く活用するための問題設定法の共有」

    動画はこちら→ https://youtu.be/ppkgYD69NDU

    AIを実践的に活用する際、どのような問題を設定すべきか?
    AIで解くべき問題が分かると、実践的なデータ利活用ができます
    第1回では、サブスクリプション・ビジネス(解約防止、Life-Time Valueの予測)における問題設定の秘訣を話しました

    第2回 「アンケートと機械学習で効率的な顧客理解の実践方法の共有」

    動画はこちら→ https://youtu.be/-s1PcLQUBNI

    アンケート回収数が少なくアンケート結果が眠っている企業も多いのではないでしょうか?
    今回の「すいすい会」では、アンケートと機械学習の組み合わせの事例を紹介しました

    第3回「機械学習の初心者卒業: 分類問題の精度評価手法と不均衡データの実践的な取り扱い」

    動画はこちら→ https://youtu.be/q6WJDTOgotA

    実社会では不均衡データを扱うのが普通ですが、教科書ではあまり触れられていないため、不均衡データの実践的な取り扱い方をお話ししました

    第4回「自動機械学習での特徴量の作り方」

    動画はこちら→ https://youtu.be/Ms52EnCRk8g

    自動機械学習の工程の中で最も時間を要するのが予測ターゲットを説明する特徴量データの準備になります。特徴量の考え方、アンチパターン、モダンなアルゴリズムで不要な特徴量処理をお話しました。また、Tableauなどの可視化ツールで事前に分析しておくべきことと自動機械学習での特徴量エンジニアリングの使いどころをお伝えしました。

    第5回「ForecastFlowで自動機械学習をやってみよう」

    自動機械学習の仕事の進め方をForecastFlowのデモ(分類問題と回帰問題)を通して紹介しました。このデモは幕張で開催された「AI・業務自動化 展」より生放送でお送りしました。

    第6回「予測スコアを用いた効果的な施策実施」

    動画はこちら→ https://youtu.be/8Sm8ex6taE8

    自動機械学習ForecastFlowを使うと、顧客一人一人のレベルで予測スコアを自動で算出できるようになります。これからの出来事が予測できるので、効率的に施策を実施することができます。その実行手順や考え方を説明します。

    第7回「時系列のセンサーデータを扱ったPredictive Modelでの予測について」

    動画はこちら→ https://youtu.be/P09VdyyVtHs

    ビジネスシーンで扱うデータの多くは時系列データであり、予測に関して、数多くのモデルが存在します。NASAの研究の一つである飛行機のタービンエンジン機器のセンサーデータを用いて、故障予測を中心にお話しました。

    第8回「データ活用を推進するマネージャが知っておくべき自然な摂理」

    動画はこちら→ https://youtu.be/SZvqLKRET3Y

    データ活用の推進とリモートワークにより、各マネージャは静かな大変動に直面しています。データを活用する上で自然な摂理がいくつか存在しており、それらをベースにマネージャとしてデータを効率的に使うための環境整備のヒントをお話しました。

    第9回「自動機械学習での予測モデル分割による詳細分析」

    動画はこちら→ https://youtu.be/2uH_em9b3X4

    自動機械学習ツールForecastFlowの予測モデル分割機能を用いて、「米国電話会社の解約予測」と「海外旅行ユーザの予測」の事例紹介を行いました。

    第10回「はじめての自動機械学習(ForecastFlow)」

    動画はこちら→ https://youtu.be/GlGdh05TTx4

    GRIが開発した自動機械学習ツール「ForecastFlow」を使って、自動機械学習に関して説明しました。

    ※動画や資料は弊社コーポレートサイトでもご覧いただけます

    https://gri.jp/news/12924

    関連するイベント