データマイニングに代表されるデータアナリティクス(Data Analytics)は、統計や機械学習といったデータ分析手法を使用して大量のデータを分析し、その中から今まで知られていなかった知識を取り出し、意思決定や将来の予測に役立てる技術です。データサイエンティストやエンジニア、ITチームは、様々なビーグデータ解析のための高度なデータアナリティクスシステムを、MATLABを使って構築しています。データアナリティクスは、予防保全のための故障予測や、テレマティクス、先進運転支援システム(ADAS)、センサーデータ解析にいたるまで、様々な場面で活用されています。MATLABには、BIシステムやオープンソースソフトウェアにはない、データアナリティクスに必要な機能が揃っています。

実世界のデータ: MATLABはセンサーデータ、画像、動画、テレメトリー(遠隔測定)データ、バイナリデータ、その他のリアルタイム形式をネイティブサポートしています。Hadoop向けMapReduce機能を使用したり、ODBC/JDBCデータベースへのインターフェースを使って、データを探索することができます。

統計、機械学習、ニューラルネットワーク、そしてその先へ: MATLABには、統計や機械学習の機能に加え、非線形最適化システム同定の手法、さらに数千におよぶ画像処理、動画像処理、金融モデリング、制御システム設計のためのアルゴリズムが予め用意されています。

大規模なデータセットの高速処理: MATLABで繰り返し計算する処理は、簡単にクラスタやクラウド上のHPC環境で並列計算させることができます。

オンラインシステムやリアルタイム組み込みハードウェアへの展開: MATLABで開発したデータアナリティクス機能は、エンタープライズシステムやクラスタ、クラウドに簡単に組み込むことができます。また、リアルタイム組み込みハードウェアをターゲットにすることもできます。

MATLABのアナリティクスにより、実データから意思決定に役立つ知見を得る

"クライアントの業界に関わらず、またクライアントが解析したいデータ(テキストデータ、音声、画像、動画)に関わらず、MATLABを使うことで明確な結果を、より迅速に得ることができました。"

Dr. G. Subrahamanya VRK Rao, Cognizant

 

データアクセスとデータ探索

データアナリティクスの最初のステップは、大量のデータにアクセスすることです。多くのデータにアクセスすることで、パターンを発見し、より深い知見を得ることができます。MATLAB を使用すると、統合された一つの環境で、次のような様々なデータソースやデータ形式を利用できます。

  • データベース (ODBC/JDBC準拠)、データウェアハウス、分散ファイルシステム (Hadoop)
  • 金融データサーバー内の市場関連のリアルタイムデータおよびヒストリカルデータ
  • IoT (Internet of Things) デバイス
  • OPCサーバー内の産業プラント関連のリアルタイムデータおよびヒストリカルデータ
  • テキスト、スプレッドシート、XML、CDF/HDF、画像、音声、映像、地理空間データ、WebコンテンツなどのファイルI/O

データの前処理とデータマンジング

様々なソースやリポジトリのデータから予測モデルを開発する際、エンジニアやデータサイエンティストは、予めデータの前処理を行う必要があります。例えば、欠損値や異常値がある場合もあれば、データによって使用しているタイムスタンプの形式が異なる場合もあります。MATLABを使うと、次のような時間のかかる作業も簡単に実行できます。

  • エラー、外れ値、重複があるデータのクリーニング
  • 破棄、フィルター処理、補間といった欠損データの処理
  • 高度な信号処理手法を使用したセンサーデータのノイズ除去
  • サンプリング周波数が異なるデータのマージと整形
  • 高次元データの次元数を減らしてモデルの予測精度を高めるための特徴選択
  • 次元削減のための特徴抽出と特徴変換
  • 信号処理、画像処理、動画像処理といったドメイン分析

予測モデルの構築

データアナリティクスの最も重要なポイントは、データから予測モデルやそのプロトタイプを構築して、将来の発生確率を予測することです。MATLABを使うと、ロジスティック回帰、分類木、サポートベクターマシン、アンサンブル法といった複数の機械学習手法を比較し、モデルの改良および低次元化ツールを使用して、予測精度を最大限に高めた正確なモデルを作成することができます。また、金融データ、信号、画像、動画像などの各種データを処理してマッピングできるフレキシブルなツールが用意されおり、同じ開発環境内で様々な分野向けのデータアナリティクス機能を開発することができます。


データアナリティクスのITシステムへの統合

MATLAB で開発したデータアナリティクス機能は、コードを書き直したり、カスタムインフラストラクチャを作成したりすることなくIT 環境に統合できます。MATLAB のデータアナリティクス機能は、JavaMicrosoft .NET、Excel、Python、C/C++ など、幅広い開発環境と互換性のある配布可能なコンポーネントとしてパッケージ化できます。 データアナリティクス機能をスタンドアロンのアプリケーションとして共有することや、Webアプリケーション、データベースアプリケーション、デスクトップアプリケーションおよびエンタープライズアプリケーションの一部として実行することも可能です。待ち時間が短く、拡張性の高いアプリケーションをご希望の場合は、様々なアプリケーションから呼び出し可能な、一元管理されたサービスとして運用することも可能です。