データビジュアライゼーション

データビジュアライゼーションとは、データをプロット、チャート、マップ、3D 可視化などのグラフィカルな表現に変換するプロセスです。これらの表現を使用すると、データのパターン、トレンド、外れ値の特定が簡単になります。

特にセンサー、データロガー、医療記録、Web 検索パターン、購入パターンなどのソースからのビッグデータにおいて、生データを見るだけでは検出が困難または不可能な関係を、データビジュアライゼーションによって特定できます。データビジュアライゼーションは、データを実用的な情報に変換する上で重要な役割を果たします。

データビジュアライゼーションの用途

データビジュアライゼーション手法は領域によって異なります。

金融工学

データビジュアライゼーションは、過去またはライブの市場データを使用して、パターンおよびトレンドを迅速に特定したり、異常を検出したり、意味のある洞察を得るのに役立ちます。データビジュアライゼーションは、解析の実行、予測モデルの作成、リスクの評価、および取引戦略の策定に利用できます。

下のプロットでは、過去のデータに当てはめられた時系列モデルから電力スポット価格の将来の動向をシミュレーションしています。

過去のスポット価格とトレンドを、シミュレーションされたスポット価格とトレンドとともに示している電力スポット価格のプロット。X 軸が日付、Y 軸がスポット価格を示しています。

過去のデータを予測された確定的なトレンドとともに示す電力スポット価格のプロット。

信号処理

信号処理は、音声分析、心拍数監視、無線通信、リモートセンシング、気候監視、GPS などの用途で使用されます。一般的なタスクでは、信号の前処理と比較、デジタルフィルターの設計、信号の変換、測定の実行、およびパターンとイベントの検出を行います。データビジュアライゼーションは、時間、周波数、および時間-周波数領域で目的の信号を解析するために使用されます。

下のプロットは、太平洋のシロナガスクジラの音声データを示したものです。この可視化は、時間および周波数領域で信号を可視化できる信号アナライザーアプリを使用して MATLAB® で作成されました。

太平洋のシロナガスクジラの音声から抽出された信号データおよびデータのグラフが示された、信号アナライザーアプリのスクリーンショット。

太平洋のシロナガスクジラの音声から抽出された関心領域。

画像処理およびコンピューター ビジョン

画像および動画処理は、形状の検出、オブジェクトのカウント、色の特定、オブジェクト プロパティの測定、その他の有意の情報の検出に利用できます。画像処理手法は、コンピューター ビジョンのワークフローで前処理手順としてよく適用されます。この領域での用途には、スマートフォンの顔認識、自動運転車での歩行者および車両の回避、ビデオ監視、医療 MRI での腫瘍検出、その他の画像検索システムなどがあります。

たとえば、BMW は Assisted Driving View (ADV) においてコンピューター ビジョンの機能を使用し、周辺車両の描写と車両タイプの識別を行っています。

オブジェクト検出を示す、BMW の Assisted Driver View のスクリーンショット。

BMW の Assisted Driver View。画像レジストレーション、オブジェクト検出、グラウンド トゥルースのラベル付け、およびテスト出力に照らした ADV シーンのテストなどの自動検証に MATLAB が使用された。

人工知能 (AI)

データビジュアライゼーションは、AI モデルの開発に重要な役割を果たします。機械学習やディープラーニングを用いた AI モデルは大規模なデータセットを使用するため、そのままでは解釈が困難であるためです。機械学習では、クラスター分析が異常の検出や教師あり学習でのデータの前処理に役立ちます。主成分分析 (PCA) および t 分布確率的近傍埋め込み法 (t-SNE) は、最もよく使用される 2 つのデータビジュアライゼーション手法です。これは、データの次元数を削減して、特徴的な主要次元に焦点を合わせることができるからです。

ディープラーニングでは、ネットワークの正確性および損失のプロットなどのデータビジュアライゼーションを使用して学習進行状況を監視したり、勾配で重みが付けられたクラス活性化マッピング (Grad-CAM)、オクルージョン感度、局所的に解釈可能なモデル非依存の説明 (LIME)、ディープドリームなどの可視化手法を使用して学習済みネットワークを調査したりすることができます。

異なる 3 種のあやめを示した、マハラノビス、コサイン、チェビシェフ、およびユークリッドのプロット。

フィッシャーのあやめのデータセットを使用した、種の異なるあやめのプロット。関数 tsne を使用してプロットされた可視化。

データビジュアライゼーションの仕組み

ソフトウェアは、生データをプロット、チャート、図などのリッチな可視化に変換する機能を提供します。以下は、自転車の交通密度データを示す例です。生データを目視で検査するだけでは、データ点間の関係を特定するのは困難です。

自転車交通密度の生データのプレビュー。
タイムスタンプ 曜日 総数 西向き 東向き 時間
‘2015-06-24 07:00:00’ ‘水曜日’ 141 13 128 7
‘2015-06-24 08:00:00’ ‘水曜日’ 327 44 283 8
‘2015-06-24 09:00:00’ ‘水曜日’ 184 32 152 9
‘2015-06-24 10:00:00’ ‘水曜日’ 94 30 64 10
‘2015-06-24 11:00:00’ ‘水曜日’ 67 24 43 11
‘2015-06-24 12:00:00’ ‘水曜日’ 66 32 34 12
‘2015-06-24 13:00:00’ ‘水曜日’ 67 32 35 13

下の棒グラフでは、曜日ごとの自転車交通密度の増減が示されています。自転車利用者の数は週末より平日の方が多いことが分かります。このことから、このルートの自転車利用者は主に、通勤に自転車を使用していると推論できます。

曜日ごとの自転車利用者の中央値を示す棒グラフ。

棒グラフを使用してプロットされた自転車交通データ。

散布図を使用して、同じデータからさらに洞察を得ることができます。次のプロットでは、特定の時間帯における、東および西に向かっている自転車の総数が示されています。このプロットに基づいて、東に向かうルートは商業区域に通じており、西に向かうルートは居住区域に通じていると結論付けることができます。さらに、ラッシュアワーの通行は、東向きのルートの午前 8 時 00 分から 10 時 00 分、西向きのルートの午後 4 時 00 分から 6 時 00 分であることがわかります。

ボストンの自転車交通の散布図。X 軸は時間帯、Y 軸は自転車の総数です。青の点は東に向かう自転車利用者、ブラッドオレンジの点は西に向かう自転車利用者を示しています。

時間帯別の東向きおよび西向きの自転車交通。

粒子群チャートは特殊な種類の散布図であり、時間帯、曜日、方向の自転車交通の密度パターンを表示できます。

ボストンの自転車交通量を平日、時間帯、進行方向でプロットし、自転車レンタル数の密度を表示した粒子群チャート。

曜日と方向別の自転車交通密度。

自転車交通の例では、棒グラフ、散布図、粒子群チャートなどのさまざまなタイプのプロットを使用してデータを可視化することで、交通のピークの曜日、通勤方向、最も交通量が多い時間帯などの役立つ情報をデータセットから抽出できます。

MATLAB によるデータビジュアライゼーション

MATLAB は、データの解析やアルゴリズムの開発、モデルの作成に使用されているプログラミングおよび数値計算プラットフォームです。MATLAB への直接のデータ取得、そのデータの解析と可視化、および結果のエクスポートなど、データ解析ワークフロー全体をサポートしています。対話型のアプリを使用することで、コードを記述することなくデータを可視化できます。アプリによって適切な MATLAB コードが自動的に生成されるため、作業を自動化し、再利用できます。

データビジュアライゼーションの方法

MATLAB には、ラインプロット、散布図、分布プロット、地理的プロットなどのさまざまな組み込みのチャートタイプが用意され、多様なアプリケーションからのデータセットを可視化できます。可視化の作成は、対話的に行うか、MATLAB 言語を使用してプログラムで行うことができます。

データビジュアライゼーションの探索

以下のような操作で、可視化を対話的に探索することができます。

  • データセットの特定のセクションをズームインおよびズームアウトする
  • 可視化を対話的にパニングおよび回転させる
  • 可視化して、トレンドラインまたはデータ値を直接表示する
  • データ点をシェーディングおよび強調表示する
  • 領域間を切り替える (たとえば、時間、周波数、S、Z 領域)

データビジュアライゼーションの注釈付けとカスタマイズ

以下のような方法で、伝えたい重要な情報を強調表示することで、可視化に対話的に注釈を付けることができます。

  • 主要なデータ点に注釈を付ける
  • データヒントを追加する
  • 軸ラベルを追加する
  • 異なる色とパターンでグループ化する
  • データマーカー、ラインスタイル、および色を追加する

MATLAB では、対話的に行ったチャートの変更からコードが自動的に生成されます。そのコードをスクリプトに追加して再利用できます。

I-Q 信号のプロットのグラフ。X 軸は x、Y 軸は正規化された振幅です。同相信号および直交信号が示されています。

可視化を変更したときの [コードを更新] オプション。

複雑なデータセットは、シンプルなチャートを使用して可視化するのが難しい場合があります。MATLAB では、可視化のニーズに合わせてカスタムチャートを作成し、カスタムの操作を追加できます。

以下はその例です。

  • スパークライン コンポーネント: テーブルなどのマルチ ベクトルデータ セットで、各ベクトルの一般的なトレンドを示す小さなライングラフを作成します。各行/列のデータトレンドを確認および比較できます。
  • 密度散布図: 色 (または透明度) を使用して点の密度を識別します。
スパークライン コンポーネントと密度散布図のスクリーンショット。両方ともラベルが付けられていないデータをプロットしています。

(左) スパークライン コンポーネントと (右) 密度散布図。

MATLAB Central の File Exchange でその他のカスタムチャート コンテナーの例をご覧ください。

データビジュアライゼーションのエクスポート

カスタマイズし、注釈付けを行った可視化を直接エクスポートして、Web、プレゼンテーション、およびレポートで使用できます。

Figure を特定の場所に保存している様子を示すスクリーンショット。

Figure のエクスポート。

データビジュアライゼーションとデータ解析の統合

データビジュアライゼーションは、データ解析および前処理と組み合わせて頻繁に使用されます。データクリーナー信号アナライザーなどの MATLAB アプリは、これらのステップを組み合わせています。

対話形式のコントロールを使用して、コードを記述することなく操作を指定できます。そうすることで、対応するデータビジュアライゼーションがアプリに直接統合されます。また、これによって特定のタスクの結果を即時に確認できます。解析と前処理が完了したら、アプリでは対応する MATLAB コードを自動的に生成できます。このコードにより、異なるデータに対しても手順を自動化できます。

特定用途向けの可視化

MATLAB のツールボックスには、可視化とデータの前処理および解析を組み合わせた対話型のアプリ以外に、特定の用途向けの可視化も用意されています。

Econometric Modeler アプリのスクリーンショット。

一変量または多変量の時系列データを可視化および解析する Econometric Modeler アプリ (Econometrics Toolbox™ 内)。

X 軸が周波数 (MHz) で Y 軸が振幅である振幅応答チャートのスクリーンショット。

多段階設計のデジタル ダウン コンバーターの各段階の周波数応答 (DSP System Toolbox™ 内)。

X 軸が周波数 (GHz) で Y 軸が dBm である、所望の信号と干渉信号のスペクトルをプロットするグラフのスクリーンショット。

Bluetooth LE ブロッキング、相互変調、および搬送波対干渉比パフォーマンステスト (Bluetooth® Toolbox 内)。

複数の次元の正規化された電力 (dB) を測定するフェーズドアレイ システムのビームフォーミング グラフィックスのスクリーンショット。

フェーズドアレイ システムのビームフォーミング (Phased Array System Toolbox™ 内)。

他のデータビジュアライゼーション ツールへの MATLAB の接続

MATLAB の計算およびデータ処理の機能を使用して、以下のような他のビジネス インテリジェンス ツールで可視化とダッシュボードを作成できます。

ユーザー事例

注目すべきデータビジュアライゼーションの用途

MATLAB のデータビジュアライゼーション機能により、さまざまな組織が研究目的を効率良く達成しています。

Ford、ドライブサイクルのテスト結果を解析するツールを開発

Ford の Vehicle Energy Management Engineering チームは MATLAB を使用して、車両のエミッション、燃費、および性能を評価する CycleTool を開発しました。このツールでは、モデルの予測およびシミュレーションと比較したハードウェアのテスト結果を可視化することで、システム パフォーマンスを評価できます。

事例を読む

MATLAB でモデルの予測およびシミュレーションと比較したハードウェアのテスト結果を可視化する機能を示すスクリーンショット。

データブラッシングにより、概要アプリケーションのトレンドを特定。

高速カメラおよび風洞を使用した蝶の飛行の復号化

ルンド大学の研究者が、蝶の特徴的な羽ばたきのパターンの仕組みを解明し、MATLAB を画像処理、データ解析、モデル化、可視化に使用しました。エンジニアは蝶の飛行行動を研究することで、さらに効率的で動的な (さらには泳ぐ) ドローンを構築できます。研究者は MATLAB のデータビジュアライゼーション機能を使用して、蝶の飛行行動の解析から着想を得た翼の設計の性能を解析および比較しました。

事例を読む

異なる翼タイプの正規化された時間でのインパルスとエネルギーを表示する 4 つのチャート。

柔軟性の高い翼により、翼の羽ばたきの力および効率を向上。

State Street Global Advisors、ESG の投資に透明性をもたらすスコアリングモデルを開発

State Street Global Advisors の開発チームは、R-Factor™ の開発の一環としてヒストグラム、散布図、箱ひげ図などの可視化を生成して、アルゴリズムを調整しました。このシステムは、投資家が十分な情報を得たうえで決定し、ESG (環境、社会、ガバナンス) スコアを改善するのに役立ちます。

事例を読む

12 個のチャートでヒストグラムが生成され、M S C I World の産業分野別に R-Factor の ESG スコアが示されています。

産業分野別の R-Factor の ESG スコアを示すヒストグラム。

Bosch、自動車テストデータの解析と可視化のための単一のプラットフォームを開発

Bosch は MATLAB を使用して ENValyzer (Engineering Test Data Visualizer and Analyzer) を開発しました。これは、測定デバイス、テストベンチ、および車両から収集されたテストデータの可視化、処理、解析、レポートの生成を行うツールです。Bosch のエンジニアは、行列プロット、単一、二次、、および複数軸のビューでデータをレンダリングできました。

事例を読む

プロミネンスレシオ (PR) と RPM のスペクトルの結果を示した ENValyzer のプロット。

プロミネンスレシオ (PR) と RPM のスペクトルの結果を示した ENValyzer のプロット。