データビジュアライゼーションとは?
これだけは知っておきたい 3 つのこと
データビジュアライゼーションとは、データをプロット、チャート、マップ、3D 可視化などのグラフィカルな表現に変換するプロセスです。これらの表現を使用すると、データのパターン、トレンド、外れ値の特定が簡単になります。
特にセンサー、データロガー、医療記録、Web 検索パターン、購入パターンなどのソースからのビッグデータにおいて、生データを見るだけでは検出が困難または不可能な関係を、データビジュアライゼーションによって特定できます。データビジュアライゼーションは、データを実用的な情報に変換する上で重要な役割を果たします。
データビジュアライゼーション手法は領域によって異なります。
金融工学
データビジュアライゼーションは、過去またはライブの市場データを使用して、パターンおよびトレンドを迅速に特定したり、異常を検出したり、意味のある洞察を得るのに役立ちます。データビジュアライゼーションは、解析の実行、予測モデルの作成、リスクの評価、および取引戦略の策定に利用できます。
下のプロットでは、過去のデータに当てはめられた時系列モデルから電力スポット価格の将来の動向をシミュレーションしています。
信号処理
信号処理は、音声分析、心拍数監視、無線通信、リモートセンシング、気候監視、GPS などの用途で使用されます。一般的なタスクでは、信号の前処理と比較、デジタルフィルターの設計、信号の変換、測定の実行、およびパターンとイベントの検出を行います。データビジュアライゼーションは、時間、周波数、および時間-周波数領域で目的の信号を解析するために使用されます。
下のプロットは、太平洋のシロナガスクジラの音声データを示したものです。この可視化は、時間および周波数領域で信号を可視化できる信号アナライザーアプリを使用して MATLAB® で作成されました。
画像処理およびコンピューター ビジョン
画像および動画処理は、形状の検出、オブジェクトのカウント、色の特定、オブジェクト プロパティの測定、その他の有意の情報の検出に利用できます。画像処理手法は、コンピューター ビジョンのワークフローで前処理手順としてよく適用されます。この領域での用途には、スマートフォンの顔認識、自動運転車での歩行者および車両の回避、ビデオ監視、医療 MRI での腫瘍検出、その他の画像検索システムなどがあります。
たとえば、BMW は Assisted Driving View (ADV) においてコンピューター ビジョンの機能を使用し、周辺車両の描写と車両タイプの識別を行っています。
人工知能 (AI)
データビジュアライゼーションは、AI モデルの開発に重要な役割を果たします。機械学習やディープラーニングを用いた AI モデルは大規模なデータセットを使用するため、そのままでは解釈が困難であるためです。機械学習では、クラスター分析が異常の検出や教師あり学習でのデータの前処理に役立ちます。主成分分析 (PCA) および t 分布確率的近傍埋め込み法 (t-SNE) は、最もよく使用される 2 つのデータビジュアライゼーション手法です。これは、データの次元数を削減して、特徴的な主要次元に焦点を合わせることができるからです。
ディープラーニングでは、ネットワークの正確性および損失のプロットなどのデータビジュアライゼーションを使用して学習進行状況を監視したり、勾配で重みが付けられたクラス活性化マッピング (Grad-CAM)、オクルージョン感度、局所的に解釈可能なモデル非依存の説明 (LIME)、ディープドリームなどの可視化手法を使用して学習済みネットワークを調査したりすることができます。
ソフトウェアは、生データをプロット、チャート、図などのリッチな可視化に変換する機能を提供します。以下は、自転車の交通密度データを示す例です。生データを目視で検査するだけでは、データ点間の関係を特定するのは困難です。
タイムスタンプ | 曜日 | 総数 | 西向き | 東向き | 時間 |
‘2015-06-24 07:00:00’ | ‘水曜日’ | 141 | 13 | 128 | 7 |
‘2015-06-24 08:00:00’ | ‘水曜日’ | 327 | 44 | 283 | 8 |
‘2015-06-24 09:00:00’ | ‘水曜日’ | 184 | 32 | 152 | 9 |
‘2015-06-24 10:00:00’ | ‘水曜日’ | 94 | 30 | 64 | 10 |
‘2015-06-24 11:00:00’ | ‘水曜日’ | 67 | 24 | 43 | 11 |
‘2015-06-24 12:00:00’ | ‘水曜日’ | 66 | 32 | 34 | 12 |
‘2015-06-24 13:00:00’ | ‘水曜日’ | 67 | 32 | 35 | 13 |
下の棒グラフでは、曜日ごとの自転車交通密度の増減が示されています。自転車利用者の数は週末より平日の方が多いことが分かります。このことから、このルートの自転車利用者は主に、通勤に自転車を使用していると推論できます。
散布図を使用して、同じデータからさらに洞察を得ることができます。次のプロットでは、特定の時間帯における、東および西に向かっている自転車の総数が示されています。このプロットに基づいて、東に向かうルートは商業区域に通じており、西に向かうルートは居住区域に通じていると結論付けることができます。さらに、ラッシュアワーの通行は、東向きのルートの午前 8 時 00 分から 10 時 00 分、西向きのルートの午後 4 時 00 分から 6 時 00 分であることがわかります。
粒子群チャートは特殊な種類の散布図であり、時間帯、曜日、方向の自転車交通の密度パターンを表示できます。
自転車交通の例では、棒グラフ、散布図、粒子群チャートなどのさまざまなタイプのプロットを使用してデータを可視化することで、交通のピークの曜日、通勤方向、最も交通量が多い時間帯などの役立つ情報をデータセットから抽出できます。
MATLAB は、データの解析やアルゴリズムの開発、モデルの作成に使用されているプログラミングおよび数値計算プラットフォームです。MATLAB への直接のデータ取得、そのデータの解析と可視化、および結果のエクスポートなど、データ解析ワークフロー全体をサポートしています。対話型のアプリを使用することで、コードを記述することなくデータを可視化できます。アプリによって適切な MATLAB コードが自動的に生成されるため、作業を自動化し、再利用できます。
データビジュアライゼーションの方法
MATLAB には、ラインプロット、散布図、分布プロット、地理的プロットなどのさまざまな組み込みのチャートタイプが用意され、多様なアプリケーションからのデータセットを可視化できます。可視化の作成は、対話的に行うか、MATLAB 言語を使用してプログラムで行うことができます。
データビジュアライゼーションの探索
以下のような操作で、可視化を対話的に探索することができます。
データビジュアライゼーションの注釈付けとカスタマイズ
以下のような方法で、伝えたい重要な情報を強調表示することで、可視化に対話的に注釈を付けることができます。
MATLAB では、対話的に行ったチャートの変更からコードが自動的に生成されます。そのコードをスクリプトに追加して再利用できます。
複雑なデータセットは、シンプルなチャートを使用して可視化するのが難しい場合があります。MATLAB では、可視化のニーズに合わせてカスタムチャートを作成し、カスタムの操作を追加できます。
以下はその例です。
- スパークライン コンポーネント: テーブルなどのマルチ ベクトルデータ セットで、各ベクトルの一般的なトレンドを示す小さなライングラフを作成します。各行/列のデータトレンドを確認および比較できます。
- 密度散布図: 色 (または透明度) を使用して点の密度を識別します。
MATLAB Central の File Exchange でその他のカスタムチャート コンテナーの例をご覧ください。
データビジュアライゼーションのエクスポート
カスタマイズし、注釈付けを行った可視化を直接エクスポートして、Web、プレゼンテーション、およびレポートで使用できます。
対話形式のコントロールを使用して、コードを記述することなく操作を指定できます。そうすることで、対応するデータビジュアライゼーションがアプリに直接統合されます。また、これによって特定のタスクの結果を即時に確認できます。解析と前処理が完了したら、アプリでは対応する MATLAB コードを自動的に生成できます。このコードにより、異なるデータに対しても手順を自動化できます。
特定用途向けの可視化
MATLAB のツールボックスには、可視化とデータの前処理および解析を組み合わせた対話型のアプリ以外に、特定の用途向けの可視化も用意されています。
一変量または多変量の時系列データを可視化および解析する Econometric Modeler アプリ (Econometrics Toolbox™ 内)。
多段階設計のデジタル ダウン コンバーターの各段階の周波数応答 (DSP System Toolbox™ 内)。
Bluetooth LE ブロッキング、相互変調、および搬送波対干渉比パフォーマンステスト (Bluetooth® Toolbox 内)。
フェーズドアレイ システムのビームフォーミング (Phased Array System Toolbox™ 内)。
注目すべきデータビジュアライゼーションの用途
MATLAB のデータビジュアライゼーション機能により、さまざまな組織が研究目的を効率良く達成しています。
Ford、ドライブサイクルのテスト結果を解析するツールを開発
Ford の Vehicle Energy Management Engineering チームは MATLAB を使用して、車両のエミッション、燃費、および性能を評価する CycleTool を開発しました。このツールでは、モデルの予測およびシミュレーションと比較したハードウェアのテスト結果を可視化することで、システム パフォーマンスを評価できます。
高速カメラおよび風洞を使用した蝶の飛行の復号化
ルンド大学の研究者が、蝶の特徴的な羽ばたきのパターンの仕組みを解明し、MATLAB を画像処理、データ解析、モデル化、可視化に使用しました。エンジニアは蝶の飛行行動を研究することで、さらに効率的で動的な (さらには泳ぐ) ドローンを構築できます。研究者は MATLAB のデータビジュアライゼーション機能を使用して、蝶の飛行行動の解析から着想を得た翼の設計の性能を解析および比較しました。
State Street Global Advisors、ESG の投資に透明性をもたらすスコアリングモデルを開発
State Street Global Advisors の開発チームは、R-Factor™ の開発の一環としてヒストグラム、散布図、箱ひげ図などの可視化を生成して、アルゴリズムを調整しました。このシステムは、投資家が十分な情報を得たうえで決定し、ESG (環境、社会、ガバナンス) スコアを改善するのに役立ちます。
Bosch、自動車テストデータの解析と可視化のための単一のプラットフォームを開発
Bosch は MATLAB を使用して ENValyzer (Engineering Test Data Visualizer and Analyzer) を開発しました。これは、測定デバイス、テストベンチ、および車両から収集されたテストデータの可視化、処理、解析、レポートの生成を行うツールです。Bosch のエンジニアは、行列プロット、単一、二次、、および複数軸のビューでデータをレンダリングできました。