データ可視化とは
データ可視化(データビジュアライゼーション)はデータサイエンスに関わる一領域であり、データ分析に使われる技術の1つです。数値やテキストなどのデータを「長さ」「 大きさ」「 角度」「 色」などの視覚表現を使って描画することで、誰でも直感的にデータの姿をつかむことができます。
昨今は、ビッグデータやAI(人工知能)の活用が進み、意思決定のエビデンス(証拠)にデータやその分析結果を求める傾向が強まっています。しかし、専門家ではない人々に説明または説得をするのに、機械判別に最適化された膨大なデータのままでは使えません。そこで、直感的にデータの特徴を伝えることができるデータ可視化の有用性が改めて注目されています。
意思疎通の手段として発展
現代のデータ可視化の歴史は、( 定まった見解ではありませんが)18世紀の棒グラフや折れ線グラフといった統計グラフの発明が端緒と見られており、200年以上の歴史があります。政治経済学者のウィリアム・プレイフェアが当時のイギリスの商業の状況を表した出版物「The Commercial and Political Atlas」( 1786年)の中で棒グラフなどを使用したことで広がりました(図1 ) 。特に棒グラフは数値を長さに変換した長方形で表現することで異なる数値の比較を驚くほど容易にしました。
図1 「 The Commercial and Political Atlas」( 1786年)の棒グラフ
また、フローレンス・ナイチンゲールは、英国政府に野戦病院の衛生状態の改善が必要なことを訴えるために、報告書に「鶏のとさか図」( 図2 )と呼ばれる円グラフの一種を掲載し政策実現を図りました。
今の時代で置き換えると、プレゼンのスライドに売り上げや消費者ニーズを表すグラフなどを盛り込むのと何ら変わりありません。直感的にデータの姿を伝えるデータ可視化は“ 説得の場” で使われ、その効力を発揮してきたと言えるでしょう。
図2 ナイチンゲールの「鶏のとさか図」
インフォグラフィックの誕生
また、一般大衆に簡潔に情報を伝達する新聞・雑誌などの報道(ジャーナリズム)分野でも積極的に活用されました。特に、記事に合わせてイラストなどを交えて解説を行う「インフォグラフィック」はジャーナリズムと共に発展してきたと言われています。ジャーナリズムにおける視覚表現は、世界最初の新聞と言われる「The Daily Courant」が創刊された1702年に始まり、新聞の歴史と歩みを共にしています。さらに、インフォグラフィックは、19世紀に萌芽し(図3 ) 、20世紀に発展、1980年代には一大ブームとなりました。
図3 19世紀初頭に出版された報道用インフォグラフィック「Ground Plan of Mr. Blight's House and Premises(ブライト氏の家と敷地の平面図) 」
1990年代以降は新聞・雑誌などのマスメディアの電子化が進むに伴ってディスプレイ上での表現が増加し、動画やアニメーションと組み合わせたり、読者が関心に従ってクリックすることで、データの検索やフィルタリングなどができるインタラクティブなものも続々と登場しています。
より身近なものに
近年、データを可視化するツールが続々と開発されています。また、利用者を広く想定したデータ分析ツールには、必ずデータを可視化する描画機能が備わっています。
データ可視化は人間が図形などを認知する脳の機能を利用したデータ表現です。図形などの認知過程は文字よりも処理が速く、情報をより短時間で直感的に捉えることができます。例えば、「 ドリルダウン分析」はその典型です(図4 ) 。データの一側面を可視化した図を目で見て確認し、その特徴などを把握、気になる点などをさらに掘り下げていくという分析手法です。データの特徴を把握するのに、データ可視化がデータ分析の“ 案内役” になってくれます。分析者は自身の認知機能を活かし、データの生の姿では見えない特徴や隠れたパターンなどを見出していきます。
図4 Tableauでドリルダウン分析の例
Tableau:https://www.tableau.com/ja-jp
データも提供されているツール
また一方で、提供しているデータをユーザが自由に可視化して確認・分析することに主眼を置いたツールもあります。
「RESAS」( 図5 )や「IHME」( 図6 )などは、提供している公開データ(オープンデータ)をユーザが手軽に可視化しながら確認・分析するためのWebツールも一緒に公開しています。例えば、政府や国際機関の統計データなどは扱っている分野も広範で多種多様です。目的のデータを引き出すのにもデータベースや目的の政策に関する専門知識が必要になってきます。しかし、データ可視化ツールを使うことで、可視化された図を見ながら目的のデータを探したり、その特徴などを調べることができるようになっています。
まずは、これらのツールでご自身の気になるデータを可視化して、分析してみてはいかがでしょうか。
図5 RESASで作成された大阪市の転出超過を表す花火図
RESAS(地域経済分析システム) :https://resas.go.jp/
図6 IHMEで描画されたシリアの死亡原因を表したツリーマップ
IHME(The Institute for Health Metrics and Evaluation) :http://www.healthdata.org/