tall 配列および mapreduce
mapreduce
を Spark™ クラスター、Hadoop® クラスター、および並列プールで使用して、ビッグ データ セットを並列解析するParallel Computing Toolbox™ を使用すると、デスクトップ上の並列プールを使って tall 配列の式を並列で評価できます。tall 配列を使用すると、マシンのメモリに収まらないビッグ データ アプリケーションを実行できます。また、Parallel Computing Toolbox を使用して、MATLAB Parallel Server™ クラスター上で実行される並列プールに接続することで、tall 配列の処理をスケール アップすることもできます。あるいは、MATLAB Parallel Server を実行する Spark 対応 Hadoop クラスターを使用できます。詳細については、tall 配列およびデータ ストアを使用するビッグ データのワークフローを参照してください。
関数
クラス
例および使用方法
- tall 配列およびデータ ストアを使用するビッグ データのワークフロー
ビッグ データセットの解析に tall 配列を使用する一般的なワークフローについて学習する。
- 並列プールでの tall 配列の使用
Parallel Computing Toolbox および MATLAB Parallel Server での tall 配列を理解する。
- クラウドでのビッグデータの処理
この例では、クラウド上の大規模データ セットにアクセスし、ビッグ データ向けの MATLAB® の機能を使用してクラウド クラスター上で処理する方法を説明します。
- Use Parallel Computing to Optimize Big Data Set for Analysis
This example shows how to optimize data preprocessing for analysis using parallel computing. (R2024a 以降)
- Spark クラスターでの tall 配列の使用
MATLAB コードを変更せずに、Spark クラスター上で tall table を作成し、使用する。
- 並列プール上での mapreduce の実行
Parallel Computing Toolbox を使用して、ビッグ データの高度な解析に
mapreduce
を試す。 - Hadoop クラスター上での mapreduce の実行
Hadoop クラスター上でのビッグ データの高度な解析に使用する
mapreduce
について学習する。 - データ ストアの並列分割
partition
を使用して、datastore
を小部分に分割する。
概念
- 並列プールでのコードの実行
並列プールの起動と終了、プールのサイズ、およびクラスターの選択について学習する。