reduceByKey

クラス: matlab.compiler.mlspark.RDD
名前空間: matlab.compiler.mlspark

結合 reduce 関数を使用して各キーの値をマージ

構文

result = reduceByKey(obj,func,numPartitions)

説明

result = reduceByKey(obj,func,numPartitions) は、結合 reduce 関数 func を使用して、obj 内の各キーに対する値をマージします。numPartitions は、結果の RDD 内に作成するパーティションの数を指定します。

入力引数

すべて展開する

`obj` — 入力 RDD
`RDD` オブジェクト

入力 RDD。RDD オブジェクトとして指定します。

`func` — 適用する結合関数
関数ハンドル

入力 RDD の要素に適用する結合関数。関数ハンドルとして指定します。

データ型: function_handle

`numPartitions` — 作成するパーティションの数
スカラー値

作成するパーティションの数。スカラー値として指定します。

データ型: double

出力引数

すべて展開する

`result` — キーごとに削減された値を含む RDD
`RDD` オブジェクト

キーごとに削減された値を含む、パイプライン化された RDD。RDD オブジェクトとして返されます。

例

すべて展開する

キーごとに値を削減

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% reduceByKey
inputRDD = sc.parallelize({'A','B','C','A','B'},2);
redRDD= inputRDD.map(@(x)({x,1})).reduceByKey(@(x,y)(x+y),3);

バージョン履歴

R2016b で導入

参考

reduce | reduceByKeyLocally | map | collect | parallelize

reduceByKey

構文

説明

入力引数

obj — 入力 RDD RDD オブジェクト

func — 適用する結合関数 関数ハンドル

numPartitions — 作成するパーティションの数 スカラー値

出力引数

result — キーごとに削減された値を含む RDD RDD オブジェクト

例

キーごとに値を削減

バージョン履歴

参考

`obj` — 入力 RDD
`RDD` オブジェクト

`func` — 適用する結合関数
関数ハンドル

`numPartitions` — 作成するパーティションの数
スカラー値

`result` — キーごとに削減された値を含む RDD
`RDD` オブジェクト