グラフの見た目で、人は簡単にデータに騙される? #データのトリセツ
仕事をしている中で、多くの人がデータを扱っています。例えば、アンケートを実施すると、そのデータを集計して報告する場面があります。グラフなどを使って表現して、わかりやすく伝えることが求められることもあるでしょう。
このとき、見た目を工夫すると簡単に相手を誘導できます。逆に、他人が作ったグラフなどを見るときは、その表現に騙されないようにしなければなりません。そこで今回は、世の中で使われている代表的なグラフを紹介し、その注意点を解説します。
使うグラフを選ぶ
グラフとひと言で言っても、棒グラフや折れ線グラフ、円グラフなど多くの種類があります。このため、グラフを使って表現するときに、どのグラフを使うのかで迷うことがあるかもしれません。例えば、次の表のデータがあったとき、あなたはどのグラフを使うでしょうか?
例1)情報処理技術者試験の応募者数(2018年春期)
試験 | 基本情報 技術者 |
応用情報 技術者 |
プロジェクト マネージャ |
データベース スペシャリスト |
安全確保 支援士 |
---|---|---|---|---|---|
応募者数 | 73,581 | 49,223 | 18,212 | 17,165 | 23,180 |
例2)データベーススペシャリストの応募者数の推移
年度 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 |
---|---|---|---|---|---|---|---|
応募者数 | 18,799 | 17,489 | 15,807 | 15,355 | 13,980 | 17,706 | 17,165 |
例3)データベーススペシャリストの年齢別応募者数(2018年)
年度 | 10代 | 20代 | 30代 | 40代 | 50代 | 60代 | 70代 |
---|---|---|---|---|---|---|---|
応募者数 | 53 | 5,220 | 7,101 | 3,787 | 962 | 41 | 1 |
いずれの表も数値データで、その大小を比べることに意味がありそうです。ただ、すべて同じ形式のグラフを使うのは好ましくありません。そのデータの意味を考え、何を伝えたいのかを意識してグラフを作る必要があります。
例1のデータを見ると応募者数の「量」に注目する人が多いと思いますが、例2のデータを見ると応募者数の「推移」に注目する人が多いでしょう。また、例3の場合にはそれぞれの年齢において、どれくらいの「割合」を占めているのかに注目する人が多いと思います。
そこで、それぞれの特徴をグラフで表現することにより、わかりやすく伝えることを考えます。例えば、よく使われるのは以下のようなグラフです。
ここで、上記のグラフが正解だということではありません。例2は折れ線グラフを使う場合が多いと思いますが、例1で割合を伝えたい場合には円グラフを使うこともありますし、例3で量を伝えたい場合には棒グラフを使うこともあります。大切なのは「何を伝えたいか」ということです。
伝えたいことを絞ることが大切
上記でもグラフとしては十分ですが、単純に表をグラフにしただけで、何を伝えたいのかよくわかりません。例えば、例1で棒グラフを作った人は何を伝えたいのでしょうか? 基本情報技術者の応募者数が多いことを伝えたいのか、データベーススペシャリストの応募者数が少ないことを伝えたいのか、このグラフを見ただけではわからないのです。
例2のデータとして「データベーススペシャリスト」を出している、ということは後者でしょうか? もしデータベーススペシャリストの応募者数を増やしたい、ということであれば、それをわかりやすく伝える必要があります。
例えば、グラフの中でデータベーススペシャリストに該当する部分だけ色を変える、もしくはメッセージを入れる、などいろいろな工夫ができます。
2つ目のグラフも同様で、応募者数がどのように推移していることを伝えたいのでしょうか? 全体として減少傾向にあることを伝えたいのか、2016年に底を打って応募者数が増えつつあることを伝いたいのかわかりません。
これもグラフにメッセージを入れることで、相手に与える印象は大きく変わります。例えば、以下のように矢印を1つ入れるだけで、見た目に受ける印象は変わってくるはずです。もちろん、受け取る立場の場合は、恣意的に作られたメッセージに惑わされないように注意が必要です。
軸を変えると見た目が大幅に変わる
注意しなければいけないのは、軸を変えると見た目が大幅に変わってしまうことです。例えば、例2のデータを折れ線グラフで表現する場合も、以下のような違いがあります。いずれも同じデータを使っていますが、そのグラフから受ける印象が大きく異なることがわかります。
ここで変えているのは軸の間隔だけです。1つ目のグラフは縦軸を0から始めているのに対し、2つ目のグラフは縦軸が横軸と交わる点が異なります。このように変えることでその変動が大きく見えることがわかります。さらに、3つ目のグラフは横軸の間隔も変えています。
これは折れ線グラフに限った話ではありません。棒グラフの場合は「量」を表すため、基本的には縦軸を0から始めるのが基本です。ただ、値が大きい場合には、途中を省略して描かれることもあります。
問題なのは、図のような3Dグラフです。電車内の広告やテレビ番組などでよく使われますが、実際のデータとはかけ離れた印象を与えるため、グラフを見たときにはそのデータの数字を見ながら読み取るスキルが求められます。
他のグラフを使うことも考える
データの内容によっては、上記の3つのグラフ以外を使ったほうがスッキリ表現できる場合があります。例えば、例1と例3のデータが合わさったような、以下のデータをグラフに表現することを考えてみましょう。
応募者数 | 基本情報 技術者 |
応用情報 技術者 |
プロジェクト マネージャ |
データベース スペシャリスト |
安全確保 支援士 |
---|---|---|---|---|---|
2016 | 61,281 | 44,102 | 16,173 | 13,980 | 26,864 |
2017 | 67,784 | 49,333 | 18,291 | 17,706 | 25,130 |
2018 | 73,581 | 49,223 | 18,212 | 17,165 | 23,180 |
上記で使ったように円グラフを使うなら、以下のような表現が可能かもしれません。
ただ、これだと変化がなかなか掴みにくいものです。そこで、以下のようなグラフを使ってみましょう。これにより、それぞれの割合が変化している部分がよくわかります。つまり、割合と変化を一度に表現できています。
このように、グラフの特徴を理解して使い分けることが求められています。また、割合で見るのではなく、次の図のように実際の応募者数を見ることも大切です。割合だけを見ていると、実際の数に大きな偏りがある場合、正しく把握できない場合があります。この辺りについては次回に解説したいと思います。
データを表示する順番を考える
データの順番に意味がある場合も、色々な表現が考えられます。例えば、都道府県別の応募者数が与えられたとき、どのように表現するでしょうか? 1つの方法として、数値が大きい順に棒グラフに並べることが考えられます。このように表現すると、どの都道府県が多いのかすぐに把握できます。
一方、このような並べ方をすると、地方による違いがわかりにくくなります。隣り合う都道府県に量以外の関係がないため、地理的な感覚が掴めないグラフだと言えます。これを都道府県で北から並べると、次のようになります。これを見ると、近くにある都道府県がわかりやすくなります。ただ、直感的とは言えないでしょう。
そこで、日本地図上に色を変えて表現する方法も使われます。棒グラフを描くよりも作成が面倒ですが、インターネット上には多くのサービスがありますので、これらを使って表現することもできます。例えば、Google Chart APIを使うと、以下のような図が簡単に作成できます。
グラフに騙されないために
今回はデータをグラフで表現する方法をいくつか紹介しました。ただ、多くの人にとって自分でグラフを作るよりも、他人が作ったグラフを目にする機会の方が圧倒的に多いと思います。
新聞やテレビなど、多くの場所でグラフが使われていますが、中には知識の少ない読者を騙そうという意図が感じられるグラフもあります。それを正しく読み取り、理解する力が試されているのかもしれません。
最近では表計算ソフトが綺麗なグラフを出力してくれますが、そのグラフが目的にあっているのか、どのようにすれば伝わりやすいかを考えることを普段から考えてみてください。自分がグラフを作るときには、それを読み取る人がどのように感じるのかを意識することが大切です。
この連載では、データをどのように扱うと伝わりやすいのか、そして受け取る側が知っておきたい知識について解説していきます。
(著者プロフィール)
WRITING:増井 敏克(マスイ トシカツ)
増井技術士事務所 代表。技術士(情報工学部門)、テクニカルエンジニア(ネットワーク、情報セキュリティ)、その他情報処理技術者試験に多数合格。また、ビジネス数学検定1級に合格し、公益財団法人日本数学検定協会認定トレーナーとしても活動。「ビジネス」×「数学」×「IT」を組み合わせ、コンピュータを「正しく」「効率よく」使うためのスキルアップ支援を行っている。 著書に『エンジニアが生き残るためのテクノロジーの授業』『おうちで学べるセキュリティのきほん』『プログラマ脳を鍛える数学パズル』『もっとプログラマ脳を鍛える数学パズル』『図解まるわかり セキュリティのしくみ』(翔泳社)、『プログラミング言語図鑑』『シゴトに役立つデータ分析・統計のトリセツ』(ソシム)、『プログラマのための ディープラーニングのしくみがわかる数学入門』(ソシム)がある。
イラスト:湊川あい
絵を描くWebデザイナー。高等学校教諭免許状 “情報科” 取得済。マンガと図解の力で、物事をわかりやすく伝えることが好き。2014年より「マンガでわかるWebデザイン」をインターネット上に公開していたところ、出版社より声がかかる。
著書「わかばちゃんと学ぶ Webサイト制作の基本」「わかばちゃんと学ぶ Git使い方入門」「わかばちゃんと学ぶ Googleアナリティクス〈アクセス解析・Webマーケティング入門〉」
Twitter: @llminatoll Webサイト: マンガでわかるWebデザイン