エンジニアや科学者は、MATLAB® を使用して、気候学、予知保全、医学研究、金融などさまざまな分野で複雑なデータセットの整理、クリーニング、解析を行います。MATLAB には、以下の機能が用意されています。
- 工学や科学のデータ向けに設計されたデータ型および前処理機能
- 高度にカスタマイズ可能な対話形式のデータ可視化
- 対話形式のデータクリーニング、準備、コード生成をサポートするアプリとライブ エディター タスク
- 統計分析、機械学習、信号処理のためのあらかじめ用意された数千の関数
- 広範囲かつ専門的な内容のドキュメンテーション
- 簡単なコード変更とハードウェアの追加によるパフォーマンスの高速化
- 大きなコード変更なしで解析をビッグデータに拡張
- アルゴリズムを手動で再コーディングせずに、自由に配布可能なソフトウェア コンポーネントまたは埋め込み可能なソースコードに解析を自動的にパッケージ化
- 解析から自動生成される共有可能なレポート
MATLAB を使用したデータ解析
少ないコードでデータをクリーニングして解析
MATLAB のライブ エディター タスクとアプリを使用すると、データのクリーニング、機械学習モデルの学習、データのラベル付けなどの反復的タスクを対話的に実行できます。また、これらのタスクやアプリは、対話的に行った操作をプログラムで再現するために必要な MATLAB コードを生成します。
あらかじめ用意された一連の関数を使用して、センサードリフト、信号の外れ値、欠損データ、ノイズを特定し、クリーニングします。テーブルを結合し、時系列データを同期することで、個別のデータセットを組み合わせます。ライブ エディター タスクを使用すると、ライブスクリプト内でこれらの問題を対話的に解決し、コードを生成できます。データクリーナー アプリは、データの問題を特定し、複数のクリーニング手法を繰り返し設定および適用して、時系列データをクリーニングするのに役立ちます。
解析を簡単にスケールアップ
parfor
ループとマルチプロセッサ ハードウェアを使用して、コードをほとんど変更せずに並列解析を高速化します。gpuarrays
を作成して、GPU による高速化を活用し、適切なアルゴリズムを探します。tall 配列を使用して、メモリに収まらないデータセットを処理します。これにより、データ解析ワークフロー全体で数百の関数をオーバーロードし、メモリに収まらないデータを操作します。
結果を共有
実行可能ファイル、C/C++ ライブラリ、.NET アセンブリ、Java® ライブラリ、Python® パッケージなど、自由に共有可能なソフトウェア コンポーネントに解析をパッケージ化します。MATLAB コードを C および C++ コードに自動変換して、組み込みターゲットに展開します。MATLAB ライブエディターを使用して作業を文書化し、結果を PDF、Microsoft® Word、Latex、および HTML 形式のレポートにエクスポートします。