MapReduce での効果的なアルゴリズムの構築
MATLAB® に同梱の mapreduce
サンプル ファイルは、さまざまなプログラミング手法を説明しています。これらのサンプルを開始点として使用して、同様の mapreduce
計算のプロトタイプを迅速に作成できます。
メモ
これらのサンプルに関連付けられたファイルは、すべて toolbox/matlab/demos/
フォルダー内にあります。
リンクの例 | 主要なファイル | 説明 | 主なプログラミング手法 |
---|---|---|---|
MapReduce を使用した最大値の検索 | MaxMapReduceExample.m | 最大到着遅延時間の検索 | 1 つの中間キーと最小の計算。 |
MapReduce による平均値の計算 | MeanMapReduceExample.m | 平均到着遅延時間の検索 | 中間状態をもつ 1 つの中間キー (中間的な合計とカウントの累積)。 |
MapReduce を使用するヒストグラムの作成 | VisualizationMapReduceExample.m | ヒストグラムを使用するデータの可視化 | グラフィックスを生成して予備的な洞察を得るのに十分な、容量の少ないデータの要約 |
MapReduce を使用するグループごとの平均の計算 | MeanByGroupMapReduceExample.m | 各曜日の平均到着遅延時間の計算 | いくつかの中間キーを使用して、入力データのサブグループに対して簡単な計算を実行。 |
MapReduce によるイメージの最大平均 HSV の計算 | HueSaturationValueExample.m | イメージ コレクションの色相、彩度、明度の最大平均値の決定 | 3 つの中間キーを使用してイメージ データ ストアを解析。イメージを表示するために使用できるファイル名が出力されます。 |
MapReduce を使用する簡単なデータのサブセット化 | SubsettingMapReduceExample.m | 大規模なデータセットのサブセットから単一のテーブルを作成 | パターンを探すための、大規模なデータセットのサブセットの抽出。この手順は、サブセット化の基準に渡すパラメーター化された map 関数を使用して一般化されています。 |
MapReduce を使用して共分散および関連量を計算する | CovarianceMapReduceExample.m | 共分散および関連する量の計算 | いくつかの中間値を計算して同じキーで保存。共分散を使用して相関行列と回帰係数を取得し、主成分分析を実行します。 |
MapReduce を使用してグループごとの要約統計を計算する | StatisticsByGroupMapReduceExample.m | グループごとに整理された要約統計の計算 | 無名関数を使用して、パラメーター化された map 関数に追加のグループ化パラメーターを渡す。このパラメーター化により、別のグループ化変数を使用して迅速に統計値を再計算できます。 |
MapReduce を使用するロジスティック回帰モデルの近似 | LogitMapReduceExample.m | 簡単なロジスティック回帰モデルの近似 | 複数の |
MapReduce を使用する tall QR (TSQR) 行列の因数分解 | TSQRMapReduceExample.m | tall 行列の QR 分解 | 複数の |