ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

ビッグ データの処理

分散配列、tall 配列、データ ストアまたは mapreduce を使用して、Spark® クラスターおよび Hadoop® クラスター上でビッグ データセットを並列解析する

Parallel Computing Toolbox™ を使用すると、大規模な配列を複数の MATLAB® ワーカー間に並列に分散できるため、クラスターの結合メモリを使用するビッグデータ アプリケーションを実行できます。また、Parallel Computing Toolbox では MATLAB® の tall 配列および datastore の計算も並列で実行できるため、クラスターのメモリに収まらないビッグ データセットを解析できます。MATLAB Distributed Computing Server™ を使用すると、Spark 対応 Hadoop クラスター上で tall 配列および datastore の計算を並列実行できます。そうすることで、膨大なデータ計算の実行時間が大幅に短縮されます。

  • 分散配列
    分散配列と同時実行を使用してビッグ データセットを並列解析する
  • tall 配列および mapreduce
    MATLAB の tall 配列とデータ ストア、または mapreduce を Spark クラスター、Hadoop クラスターおよび並列プールで使用して、ビッグ データセットを並列解析する。