これから始めるために - 意思決定に役立つ可視化とデータ活用のポイント

イベント
これから始めるために - 意思決定に役立つ可視化とデータ活用のポイント

2019年最後のDS女子部セミナーでは、データの可視化をテーマとした2本のLTに加え、「統計学が最強の学問である」の著者である株式会社データビークル 西内 啓氏によるご講演をお届けしました。本レポートでは各講演を要約しお伝えします。

LT1『はじめてのGoogleデータポータル 〜入門から活用事例まで〜』

株式会社オールアバウト 神保 みゆき 氏

Alt text

オールアバウトは生活総合情報サイトで、さまざまなジャンルについて多様な記事が掲載されています。記事に掲載される広告の効果検証などのためにデータ分析は必須のもので、それまではHadoopなどが使用されていたとのことですが、誰もが扱えるツールではないため、分析には時間もコストもかかるものでした。それぞれの現場が自由にデータを分析できる環境を実現すべく、Google社が提供する無料のBIツール「Googleデータポータル(旧データスタジオ)」の社内利用を促進しています。

Google データポータルでは、様々なデータソースを一つのダッシュボードで可視化でき、BigQueryやMy SQLなど様々なデータソースとの連携も可能です。ドラッグ&ドロップでビジュアル化したレポートを簡単に作成することができます。作成したレポートには参照権限を設定でき、社内のメンバーやマネージメントとも簡単に共有できる点も魅力です。

Googleポータルを利用することで、各部門が自分たちでレポートを簡単に作成できることがわかり、すぐに社内に広まりました。例えば編集部では、KPIの達成状況の確認や広告効果の検証、取得したデータの検証などに使わっています。 もしすでに、有料のBIツールを使っている環境であれば、わざわざGoogleポータルに切り替える必要はないかもしれません。BIツールをまだ何も使っておらず、データ分析をどこから始めればよいかと悩んでいるのであれば、このように無料で使い勝手のよいツールの利用から始めることがおすすめです。

LT2『Lookerを使って分析から次のアクションへ』

Looker 西見 麻利子 氏

Alt text

Lookerは、2012年に米国カルフォルニアで設立され、サンタクルーズを本社とする会社です。カスタマーサポートのチームの名称、DCL (Department of Customer Love)とあるのは、会社のカルチャーをよく伝えていると思います。2018年9月にアジア唯一の拠点として東京オフィスが開設されました。2019年6月にGoogleが同社を買収することが発表されており、GoogleのCloud Serviceに組み込まれる予定とのことです。

Lookerのサービスは、データ分析のためにはデータエンジニアによるデータ出力が必要でリアルタイムな分析ができなかったことを課題と捉えたところから生まれました。特徴的なのは、Looker自体はデータを持たずDBに直接アクセスすること、そして、人によって異なるデータ項目の定義(例えば、”売上金額“が税込の値か、税抜きの値か、など)をLookerで一元管理し定義のズレを解消する仕組みです。

各種のグラフを組み合わせ簡単にリッチなビジュアルのレポートをつくることが可能なツールで、このようなレポートの定期出力をスケジューリングしたり、レポートをPDF化してSlackやメールで共有したりと、次のアクションにつなげるための機能が充実しています。

日本でも、大きな企業からマンションの一室から始めるようなスタートアップと、ユーザー企業が増えてきています。

講演『見える化の、その先』

株式会社 データビークル 最高製品責任者 西内 啓 氏

Alt text データサイエンスをすべての人にという考えで、データビークルを立ち上げました。データドリブンによる意思決定が企業の生産性やROIは高いという研究結果は2011年からありますが、実際にはデータや分析を活かせていないという企業が多く相談をいただきます。これまではBIツールを使ってきたというケースが多く、経験と感に基づく仮説を裏付けるだけで、当たり前の結果しか得られない、という「見える化の壁」に直面しているようです。

BIツールが担うのは「記述的分析」、つまり過去に何が起きたかを把握することで、データドリブンによる意思決定に必要な分析は「診断的分析」です。データを元になぜそれが起きたのか因果関係を探索し、それをどう活かすかという意思決定者の指示をもとに現場が施策を実行し、分析者が効果を検証するというサイクルを回すことが重要です。

しかし、現実には、データはすぐに利用することは難しく、分析は無意味に高度なものを行い、意思決定層はレポートを「見える化」のレベルでしか理解できず、現場は施策を実行後にやりっぱなしで検証をしない、ということが多く見られます。とくにデータ分析の前のデータ収集・加工に工数が使われ、ここで挫折してしまうのです。

必要なアプローチは多くの企業が直面する課題をそれぞれシンプルにすることだと考えています。データの準備が困難であるならば、分析に必要なデータを自動生成し、アクションにつながる洞察が得られないのであれば、多様な変数から意味のある要因を自動探索し、意思決定者が集計や見える化でしかわからないのであれば、分析結果を自然言語とグラフで表示する -- 実際にこれを実現する製品をデータ・ビークルでは提供しています。

「市民データサイエンス」という言葉をガートナー社が使い始めてから久しいですが、今後は様々な企業によりツールが自動化され、データサイエンティストの関与なくデータを分析し活用できるようになっていくでしょう。そうなったときに重要なのは、過去に何が起きたのかを把握するだけの「見える化」ではなくなぜそれが起きたのか、因果関係についての仮説を「言える化」することです。

組織がデータ分析とその活用を実現するには、「ボス:数字と理屈で意思決定のリスクを取れる人」、「エキスパート:現場の事情とオペレーションの肌感覚がある人」、「データマネージャー:社内のデータとITシステムの土地勘がある人」、「分析担当者:ITとハードワークが苦にならない若手・中堅社員」の全てを備え、これによりデータと打ち手が回る組織をつくることが重要です。

グループディスカッション

Alt text

質問1:データを可視化する型が決まってしまっている。営業現場がどういう見方をしたいか、引き出せない。

アドバイス:

  • 営業現場も使えるツールを入れるのも良いかもしれない(神保氏)
  • 営業部もデータに触れる機会を作ると良いかもしれない。勉強会という名の下、全部署から人が集まり楽しく目的を持って分析する機会を設けているクライアントがあった(西見氏)
  • 「ずれ」を感じているのは、データを見てくれているということなのでいいことどの数字が出てくると嬉しいか、その「嬉しい」の先にどんなメリットがあって、どういう結果であれば意思決定ができるか、を話し合ってみるとよい。(西内氏)

質問2: 扱うべきデータが膨大すぎる。ツールにデータを読み込ませたが、なにから着手したらよいかわからない。また具体的には、曜日を合わせて前年比の比較をしたいが、どう操作したらよいかわからない。

アドバイス:

  • SQLを使えるようにするのは有効かもしれない。SQLはデータ分析では公用語とも言っていいもので、Procedure Languageと違って手順を書く必要なく、何が欲しいかを記述する、英語圏の人なら自然言語に近いくらいの言語。サーバーを立てるとなるとIT要件となるが、フリーのDBソフトを使いMacやPCにDBを作ってSQLを使うことも可能。予算があるならMicrosoftのSQLサーバーとPowerBIの組み合わせもよい。(西内氏)

質問3:社内でビジュアル化したグラフを共有するが、実数を見るのに慣れすぎていて、グラフを使った説明が腑に落ちていない様子。見せ方や説明の仕方として何に気をつけるべきか。

アドバイス:

  • どの項目をグラフの縦軸に持ってくると嬉しいかをまずは決めると良い。それに対していくつかの横軸を見せることで、縦軸の値を比較でき、最終的にどの横軸を選択するかを話し合うとよい(西内氏)

質問4:データ可視化のためにWebアプリケーションを作り使っている。世の中には便利なBIツールがたくさんあるのに、使えていない

アドバイス:

  • Googleデータポータルのような無料ツールでもデータの深掘りができるようになっている。有料ツールではできることはもっと広がる(神保氏)
  • お金を出す価値があるか、だと思う。ある程度の分析ならば無料ツールをお勧めすることもある(西見氏)

質問5:データを入力する部門と管理する部門、使う部門がバラバラで縦割り。必要ないデータや、利用できないデータが無駄に溜まっているとも言える。データ加工の前の段階で、困っている。

アドバイス:

  • 一緒に分析を回してみましょう、と誘うことは有効かもしれない。成果が出ればそれでよいし、足りないデータがあればリクエストしやすい(西内氏)

質問6:定性データを重視しがちなチームに、定量データの重要性とツールの有用性を啓蒙しなくてはならない。

アドバイス:

  • 社会科学では、定性と定量は両輪で、どちらも重要。過去に行ったワークショップで、運動ができるグループとできないグループに集まって、なんでできていないのだろうということを理解してもらうという試みがあった。グーグルフォームのようなものをと使い、実際にインタビュー質問から得られた定性的な回答を定量的な質問に落とし込んでデータを集め、その回答を分析するということを一緒にやってみると良いかもしれない。データとはよくわからない無機質なものではなく、だれかが思っていることをまとめているのだ、ということをデータが嫌いな人に分かってもらえる(西内氏)

質問7:分析慣れをしていないが、BIツールを使うにも統計などの知識は必要ではないか。また。決裁を取るためにどういう提案をすればよいか。

アドバイス:

  • その差が誤差であるかどうかを見極められることは必要な知識で、統計学はわかっていた方がいいと思う。ある程度データが貯まると、誤差を気にしないでよくなるし、これがBIツールを使う境界と言えるかもしれない。導入の意思決定者に、ライバルはこういうことをやっていますよ、と伝えたりすると有効かもしれない(西内氏)

質問8:エクセルに依存しており、抜けだせない。

アドバイス:

  • Excelが悪いとは思わないが、Excelを使うことによってなにか問題が起きているなら、その問題を明らかにし対応できるツールを検討する(西見氏)
  • 具体的にデータや分析過程が見えないと不安な人はExcelにこだわる。抽象化が苦手なタイプなので、具体的に説明して、それをまとめるとこうなる、と説明することが重要。データ量が多くExcelでは対応できないというのであれば、その人の前で作業してPCが逼迫するところを見せるのもアイデア(西内氏)

質問9:分析をしようとしても、データに欠損があったりマスクされていたりして、手動でのクレンジングが必須。カラムごとのデータが一定ではなかったりする

アドバイス:

  • データをすべてきれいにすることは現実的ではない。必要なところから、例えばお金が具体的に動くところやコンバージョンに関係するところから、データをきれいにしていくと良い。あるいは、直近のデータから綺麗にする。結果が出てくるようになると、データを入力際に適切なデータを入れるよう協力してもらいやすい(西内氏)

最後に・・・

「見える化」の重要性と必要性は、いまや誰もが同意するところでしょう。しかしながら、実際にこれができている企業はまだごく一部なのかもしれません。 今回のセミナーでは、Google データポータルとLookerという2つのとても使いやすそうツールを紹介いただきました。またグループディスカッションで共有された、皆さんが直面している課題と講師達のアドバイスを参考に、次のステップへと進むイメージをより具体的に持っていただけたのではないかと思います。さらに「見える化」に止まらず、なぜその事象が起きたのかの因果関係を明らかにすること、すなわち「言える化」を目指さなくてはならないという西内氏のメッセージはとても印象的でした。

関連するイベント

おすすめのコラム

DX時代に求められる非構造化(音声・時系列)データとは ──クラウドエース・PERSOL・セコムの最新活用事例

イベント

【事例①クラウドエース】GCPではじめる非構造化データ分析 イベントは2部構成で行われ、前半のセッションではクラ...

DX時代に求められる非構造化(音声・時系列)データとは ──クラウドエース・PERSOL・セコムの最新活用事例