mapreducer

mapreduce および tall 配列の並列実行環境の定義

ページ内をすべて折りたたむ

構文

mapreducer

mapreducer(0)

mapreducer(poolobj)

mapreducer(hadoopCluster)

mapreducer(mr)

mr = mapreducer(___)

mr = mapreducer(___,'ObjectVisibility','Off')

説明

例

mapreducer は、mapreduce または tall 配列の実行環境を定義します。関数 mapreducer は、実行環境を変更して異なるクラスターを使用する場合、または逐次開発と並列開発を切り替える場合に使用します。

既定の実行環境では、ローカルの MATLAB^® セッションまたは並列プール (Parallel Computing Toolbox™ がある場合) が使用されます。Parallel Computing Toolbox がインストールされている場合、関数 tall または関数 mapreduce を使用すると、既定の基本設定を変更していない限り、ワーカーの並列プールが MATLAB により自動的に起動されます。既定の並列プールではローカルワーカーが使用され、通常はマシンの各コアにつき 1 つのワーカーが使用されます。[parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] オプションをオフにしている場合、並列リソースを使用するには明示的にプールを起動しなければなりません。並列基本設定の指定を参照してください。

tall 配列を扱うときには、mapreducer を使用して実行環境を設定してから tall 配列を作成します。tall 配列は、作成された時点現在のグローバル実行環境にバインドされます。その後、グローバル実行環境を変更した場合、tall 配列は無効になり、再作成しなければなりません。

メモ

MATLAB では、mapreducer を使用して構成設定を指定する必要はありません。mapreduce アルゴリズムと tall 配列の計算は、自動的にローカルの MATLAB セッションのみで実行されるからです。Parallel Computing Toolbox もインストールされている場合は、並列実行用にこのページにリストされている追加の mapreducer 構成オプションを使用できます。MATLAB Compiler™ がインストールされている場合は、展開先環境で実行するための別の mapreducer 構成オプションを使用できます。

MATLAB のドキュメンテーションの mapreducer、または MATLAB Compiler のドキュメンテーションの mapreducer (MATLAB Compiler) を参照してください。

入力引数をもたない mapreducer は、すべて既定値が指定された mapreducer 実行環境を新規作成し、これを現在の mapreduce または tall 配列の実行環境に設定します。gcmr を使用して、現在の mapreducer の構成を取得できます。

既定の基本設定 ([parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] がオン) が使用され、並列プールが開かれていない場合、mapreducer は既定のクラスタープロファイルを使用してプールを開き、このプールに基づいて gcmr を mapreducer に設定してから、この mapreducer を返します。
並列プールが開いている場合、mapreducer は現在のプールに基づいて gcmr を mapreducer に設定し、この mapreducer を返します。
[parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] がオフであり、並列プールが開かれていない場合、mapreducer はローカルの MATLAB セッションに基づいて gcmr を mapreducer に設定し、mapreducer がこの mapreducer を返します。

例

mapreducer(0) は、並列リソースを使用せずに mapreduce または tall 配列の計算が MATLAB クライアントセッションで実行されるように指定します。

mapreducer(poolobj) は、mapreduce または tall 配列を並列実行するための並列プールを指定します。poolobj は parallel.Pool オブジェクトです。既定のプールは gcp によって返されるか、または開かれる現在のプールです。

mapreducer(hadoopCluster) は、mapreduce または tall 配列を並列実行するための Hadoop^® クラスターを指定します。hadoopCluster は parallel.cluster.Hadoop オブジェクトです。

mapreducer(mr) は、前に作成した MapReducer オブジェクト mr の ObjectVisibility プロパティが 'On' であれば、そのオブジェクトを使用して mapreduce または tall 配列のグローバル実行環境を設定します。

mr = mapreducer(___) は、MapReducer オブジェクトを返して実行環境を指定します。複数の MapReducer オブジェクトを定義でき、いずれかのオブジェクトを入力引数として mapreducer または mapreduce に渡すことで、実行環境を切り替えることができます。

mr = mapreducer(___,'ObjectVisibility','Off') は、前の構文のいずれかを使用して MapReducer オブジェクト mr を非表示にします。この構文を使用して、mapreduce のグローバル実行環境に影響を与えることなく、新しい MapReducer オブジェクトを作成します。

例

逐次で開発してからローカルワーカーまたはクラスターを使用する

逐次で開発してローカルワーカーまたは指定されたクラスターを使用しない場合は、次のように入力します。

mapreducer(0);

tall 配列の作成後に mapreducer を使用して実行環境を変更した場合、tall 配列は無効になり、再作成しなければなりません。ローカルワーカーまたは指定されたクラスターを再び使用するには、次のように入力します。

mapreducer(gcp);

[parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] をオフにした場合の `mapreducer`

[parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] オプションをオフにしている場合、並列リソースを使用するには明示的にプールを起動しなければなりません。詳細については、並列基本設定の指定を参照してください。

次のコードは、mapreducer を使用して実行環境をローカルの MATLAB セッションに設定し、ローカルの並列プールを指定する方法を示しています。

>> mapreducer(0)
>> parpool('Processes',1);

Starting parallel pool (parpool) using the 'Processes' profile ... connected to 1 workers.

>> gather(min(tall(rand(1000,1))))

Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 1: Completed in 0.75 sec
Evaluation completed in 0.96 sec

ans =

   5.2238e-04

入力引数

すべて折りたたむ

`poolobj` — 並列実行に使用するプール
`gcp` (既定値) | parallel.Pool オブジェクト

並列実行に使用するプール。parallel.Pool オブジェクトとして指定します。

例: poolobj = gcp

`hadoopCluster` — 並列実行に使用する Hadoop クラスター
parallel.cluster.Hadoop オブジェクト

並列実行に使用する Hadoop クラスター。parallel.cluster.Hadoop オブジェクトとして指定します。

例: hadoopCluster = parallel.cluster.Hadoop

出力引数

すべて折りたたむ

`mr` — `mapreduce` および tall 配列の実行環境
MapReducer オブジェクト

mapreduce および tall 配列の実行環境。MapReducer オブジェクトとして返されます。

mr の ObjectVisibility プロパティが 'On' に設定されている場合、mr はすべての mapreduce アルゴリズムおよび tall 配列の計算に用いる既定の実行環境を定義します。ObjectVisibility プロパティが 'Off' の場合は、mr を入力引数として mapreduce に渡すことで、その特定の呼び出しの実行環境を明示的に指示することができます。

複数の MapReducer オブジェクトを定義でき、いずれかのオブジェクトを入力引数として mapreducer または mapreduce に渡すことで、実行環境を切り替えることができます。

ヒント

tall 配列を扱うアルゴリズムを開発する利点の 1 つは、コード作成が一度ですむことです。コードをローカルで作成してから、アルゴリズムを書き換えることなく mapreducer を使用してスケールアップし、Parallel Computing Toolbox、MATLAB Parallel Server™ または MATLAB Compiler が提供する機能を利用できます。

バージョン履歴

R2014b で導入

参考

mapreduce | gcmr | gcp | parallel.cluster.Hadoop | tall

mapreducer

構文

説明

例

逐次で開発してからローカル ワーカーまたはクラスターを使用する

[parfor などの並列キーワードが実行された場合に並列プールを自動的に作成する (まだ存在していない場合)] をオフにした場合の mapreducer

入力引数

poolobj — 並列実行に使用するプール gcp (既定値) | parallel.Pool オブジェクト

hadoopCluster — 並列実行に使用する Hadoop クラスター parallel.cluster.Hadoop オブジェクト