メインコンテンツ

reduceByKey

クラス: matlab.compiler.mlspark.RDD
名前空間: matlab.compiler.mlspark

結合 reduce 関数を使用して各キーの値をマージ

構文

result = reduceByKey(obj,func,numPartitions)

説明

result = reduceByKey(obj,func,numPartitions) は、結合 reduce 関数 func を使用して、obj 内の各キーに対する値をマージします。numPartitions は、結果の RDD 内に作成するパーティションの数を指定します。

入力引数

すべて展開する

入力 RDD。RDD オブジェクトとして指定します。

入力 RDD の要素に適用する結合関数。関数ハンドルとして指定します。

データ型: function_handle

作成するパーティションの数。スカラー値として指定します。

データ型: double

出力引数

すべて展開する

キーごとに削減された値を含む、パイプライン化された RDD。RDD オブジェクトとして返されます。

すべて展開する

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% reduceByKey
inputRDD = sc.parallelize({'A','B','C','A','B'},2);
redRDD= inputRDD.map(@(x)({x,1})).reduceByKey(@(x,y)(x+y),3);

バージョン履歴

R2016b で導入