【水曜お昼の雑談会】データサイエンスすいすい会 第13回「自動機械学習での特徴量エンジニアリングのテクニカル解説」

2021/03/10(水)12:00 〜 13:00 開催
ブックマーク
参加枠申込形式参加費 参加者
参加者
先着順 無料 20人 / 定員50人

イベント内容

データサイエンスすいすい会

概要

データサイエンスに関する雑談を通して、すいすいデータサイエンスを推進できるような知見を貯めていくオンライン雑談会

GRIの分析官リーダ他が参加してテーマについてお話します
参加無料、お昼を食べながらお気軽にご参加ください

スケジュール

第13回 2021年3月10日(水)12:00~13:00 
隔週で開催予定

参加方法

時間になりましたら、下記ZoomURLよりご自由にご参加ください
https://zoom.us/j/96152836275


内容

ForecastFlowなどの自動機械学習の予測結果を理解しやすくするには、インプットデータの準備の仕方を工夫するテクニックがいくつか存在します。今回は、多くの予測問題に共通する、時刻データの扱い、欠損値の扱い、カテゴリデータの扱いについて、共有いたします。

時刻データの扱い(時系列予測ではなく)

  • 時刻ではなく、リードタイムや期間に変換

欠損値の扱い

  • データに欠損値がある時のシチュエーション
  • データに欠損値がある時のForecastFlowの挙動(訓練時、推論時)
  • データに欠損値がある時のデータ準備の手順

カテゴリデータの扱い

  • カテゴリデータの持ち方(ワンホット・エンコーディングとの比較)
  • カテゴリデータを括る
  • 数値をカテゴリに変換すべきか

登壇者

古幡 征史 
株式会社GRI 取締役
Ph.D in Computer Science
GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職

参加対象

  • データサイエンスに関心のある方

参加費

無料

ハッシュタグ

#techplayjp

過去のすいすい会

スライド資料はこちら→https://gri.jp/news/12924

第1回「ビジネスでAIを上手く活用するための問題設定法の共有」
動画はこちら→ https://youtu.be/ppkgYD69NDU

AIを実践的に活用する際、どのような問題を設定すべきか?
AIで解くべき問題が分かると、実践的なデータ利活用ができます
第1回では、サブスクリプション・ビジネス(解約防止、Life-Time Valueの予測)における問題設定の秘訣を話しました

第2回 「アンケートと機械学習で効率的な顧客理解の実践方法の共有」
動画はこちら→ https://youtu.be/-s1PcLQUBNI

アンケート回収数が少なくアンケート結果が眠っている企業も多いのではないでしょうか?
今回の「すいすい会」では、アンケートと機械学習の組み合わせの事例を紹介しました

第3回「機械学習の初心者卒業: 分類問題の精度評価手法と不均衡データの実践的な取り扱い」
動画はこちら→ https://youtu.be/q6WJDTOgotA

実社会では不均衡データを扱うのが普通ですが、教科書ではあまり触れられていないため、不均衡データの実践的な取り扱い方をお話ししました

第4回「自動機械学習での特徴量の作り方」
動画はこちら→ https://youtu.be/Ms52EnCRk8g

自動機械学習の工程の中で最も時間を要するのが予測ターゲットを説明する特徴量データの準備になります。特徴量の考え方、アンチパターン、モダンなアルゴリズムで不要な特徴量処理をお話しました。また、Tableauなどの可視化ツールで事前に分析しておくべきことと自動機械学習での特徴量エンジニアリングの使いどころをお伝えしました。

第5回「ForecastFlowで自動機械学習をやってみよう」

自動機械学習の仕事の進め方をForecastFlowのデモ(分類問題と回帰問題)を通して紹介しました。このデモは幕張で開催された「AI・業務自動化 展」より生放送でお送りしました。

第6回「予測スコアを用いた効果的な施策実施」
動画はこちら→ https://youtu.be/8Sm8ex6taE8

自動機械学習ForecastFlowを使うと、顧客一人一人のレベルで予測スコアを自動で算出できるようになります。これからの出来事が予測できるので、効率的に施策を実施することができます。その実行手順や考え方を説明します。

第7回「時系列のセンサーデータを扱ったPredictive Modelでの予測について」
動画はこちら→ https://youtu.be/P09VdyyVtHs

ビジネスシーンで扱うデータの多くは時系列データであり、予測に関して、数多くのモデルが存在します。NASAの研究の一つである飛行機のタービンエンジン機器のセンサーデータを用いて、故障予測を中心にお話しました。

第8回「データ活用を推進するマネージャが知っておくべき自然な摂理」
動画はこちら→ https://youtu.be/SZvqLKRET3Y

データ活用の推進とリモートワークにより、各マネージャは静かな大変動に直面しています。データを活用する上で自然な摂理がいくつか存在しており、それらをベースにマネージャとしてデータを効率的に使うための環境整備のヒントをお話しました。

第9回「自動機械学習での予測モデル分割による詳細分析」
動画はこちら→ https://youtu.be/2uH_em9b3X4

自動機械学習ツールForecastFlowの予測モデル分割機能を用いて、「米国電話会社の解約予測」と「海外旅行ユーザの予測」の事例紹介を行いました。

第10回「はじめての自動機械学習(ForecastFlow)」
動画はこちら→ https://youtu.be/GlGdh05TTx4

GRIが開発した自動機械学習ツール「ForecastFlow」を使って、自動機械学習に関して説明しました。

第11回「大規模データ分析基盤と自動機械学習(BigQuery + Matillion + ForecastFlow」
動画はこちら→ https://youtu.be/TanBxco-kcA

大規模データ分析基盤と自動機械学習連携の手順を紹介しました。

第12回「ECの売上データに対して自動機械学習を用いた顧客行動予測」
動画はこちら→ https://youtu.be/yk3CO_fPY-4
ECの成長の鍵を2つの視点で紹介しました

  • EC分野での自動機械学習を利用する典型的な分析テーマ例の整理
  • あるイギリスのECの売上データを用いたForecastFlow(自動機械学習)のデモの共有



※動画や資料は弊社コーポレートサイトでもご覧いただけます

https://gri.jp/news/12924

関連するイベント