Main Content

MapReduce での効果的なアルゴリズムの構築

MATLAB® に同梱の mapreduce サンプル ファイルは、さまざまなプログラミング手法を説明しています。これらのサンプルを開始点として使用して、同様の mapreduce 計算のプロトタイプを迅速に作成できます。

メモ

これらのサンプルに関連付けられたファイルは、すべて toolbox/matlab/demos/ フォルダー内にあります。

リンクの例主要なファイル説明主なプログラミング手法
MapReduce を使用した最大値の検索MaxMapReduceExample.m最大到着遅延時間の検索

1 つの中間キーと最小の計算。

MapReduce による平均値の計算MeanMapReduceExample.m平均到着遅延時間の検索

中間状態をもつ 1 つの中間キー (中間的な合計とカウントの累積)。

MapReduce を使用するヒストグラムの作成VisualizationMapReduceExample.mヒストグラムを使用するデータの可視化

グラフィックスを生成して予備的な洞察を得るのに十分な、容量の少ないデータの要約

MapReduce を使用するグループごとの平均の計算MeanByGroupMapReduceExample.m各曜日の平均到着遅延時間の計算

いくつかの中間キーを使用して、入力データのサブグループに対して簡単な計算を実行。

MapReduce によるイメージの最大平均 HSV の計算HueSaturationValueExample.mイメージ コレクションの色相、彩度、明度の最大平均値の決定

3 つの中間キーを使用してイメージ データ ストアを解析。イメージを表示するために使用できるファイル名が出力されます。

MapReduce を使用する簡単なデータのサブセット化SubsettingMapReduceExample.m大規模なデータセットのサブセットから単一のテーブルを作成

パターンを探すための、大規模なデータセットのサブセットの抽出。この手順は、サブセット化の基準に渡すパラメーター化された map 関数を使用して一般化されています。

MapReduce を使用して共分散および関連量を計算するCovarianceMapReduceExample.m共分散および関連する量の計算

いくつかの中間値を計算して同じキーで保存。共分散を使用して相関行列と回帰係数を取得し、主成分分析を実行します。

MapReduce を使用してグループごとの要約統計を計算するStatisticsByGroupMapReduceExample.mグループごとに整理された要約統計の計算

無名関数を使用して、パラメーター化された map 関数に追加のグループ化パラメーターを渡す。このパラメーター化により、別のグループ化変数を使用して迅速に統計値を再計算できます。

MapReduce を使用するロジスティック回帰モデルの近似LogitMapReduceExample.m簡単なロジスティック回帰モデルの近似

複数の mapreduce 呼び出しを連結して、反復回帰アルゴリズムを実行。無名関数は情報を 1 つの反復から次の反復に渡し、map 関数に直接情報を提供します。

MapReduce を使用する tall QR (TSQR) 行列の因数分解TSQRMapReduceExample.mtall 行列の QR 分解

複数の mapreduce 呼び出しを連結して複数の因数分解の反復を実行。また、map 関数のinfo 入力引数を使用して、中間の数値キーを計算します。