aggregateByKey

クラス: matlab.compiler.mlspark.RDD
名前空間: matlab.compiler.mlspark

特定の結合関数とニュートラルな "ゼロ値" を使用して、各キーの値を集計

構文

result = aggregateByKey(obj,zeroValue,seqFunc,combFunc,numPartitions)

説明

result = aggregateByKey(obj,zeroValue,seqFunc,combFunc,numPartitions) は、seqFunc と combFunc で指定された特定の結合関数と、zeroValue で指定されたニュートラルな "ゼロ値" を使用して、各キーの値を集計します。入力引数 numPartitions はオプションです。

入力引数

すべて展開する

`obj` — 入力 RDD
`RDD` オブジェクト

入力 RDD。RDD オブジェクトとして指定します。

`zeroValue` — ニュートラルな “ゼロ値”
数値の cell 配列

ニュートラルな “ゼロ値”。数値の cell 配列として指定します。

データ型: cell

`seqFunc` — 各キーの値を集計する関数
関数ハンドル

各キーの値を集計する関数。関数ハンドルとして指定します。

データ型: function_handle

`combFunc` — seqFunc の結果を集計する関数
関数ハンドル

seqFunc の結果を集計する関数。関数ハンドルとして指定します。

データ型: function_handle

`numPartitions` — 作成するパーティションの数
スカラー値

作成するパーティションの数。スカラー値として指定します。この引数はオプションです。

データ型: double

出力引数

すべて展開する

`result` — キーによって集計された要素を含む RDD
`RDD` オブジェクト

キーによって集計された要素を含む RDD。RDD オブジェクトとして返されます。

例

すべて展開する

各キーの値の集計

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% aggregateByKey
x = sc.parallelize({'a','b','c','d'},4);
y = x.map(@(x)({x,1}));
z = y.aggregateByKey(10,@(x,y)(x+y),@(x,y)(x+y));
viewRes = z.collect()  % { {'d',11},{'a',11},{'b',11},{'c',11}}

バージョン履歴

R2016b で導入

参考

aggregateByKey

構文

説明

入力引数

obj — 入力 RDD RDD オブジェクト

zeroValue — ニュートラルな “ゼロ値” 数値の cell 配列

seqFunc — 各キーの値を集計する関数 関数ハンドル

combFunc — seqFunc の結果を集計する関数 関数ハンドル

numPartitions — 作成するパーティションの数 スカラー値

出力引数

result — キーによって集計された要素を含む RDD RDD オブジェクト

例

各キーの値の集計

バージョン履歴

参考

`obj` — 入力 RDD
`RDD` オブジェクト

`zeroValue` — ニュートラルな “ゼロ値”
数値の cell 配列

`seqFunc` — 各キーの値を集計する関数
関数ハンドル

`combFunc` — seqFunc の結果を集計する関数
関数ハンドル

`numPartitions` — 作成するパーティションの数
スカラー値

`result` — キーによって集計された要素を含む RDD
`RDD` オブジェクト