メインコンテンツ

distinct

クラス: matlab.compiler.mlspark.RDD
名前空間: matlab.compiler.mlspark

既存の RDD の個々に異なる要素を含む新しい RDD を返す

構文

result = distinct(obj,numPartitions)

説明

result = distinct(obj,numPartitions) は、重複する値を排除することにより、obj の異なる要素を含む新しい RDD result を返します。

入力引数

すべて展開する

入力 RDD。RDD オブジェクトとして指定します。

作成するパーティションの数。スカラー値として指定します。

データ型: double

出力引数

すべて展開する

入力 RDD の異なる要素を含む、パイプライン化された RDD。RDD オブジェクトとして返されます。

すべて展開する

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% distinct
inputRDD = sc.parallelize({1,2,1,2});
dRDD = inputRDD.distinct();
viewRes = dRDD.glom().collect()  %{1,2}

バージョン履歴

R2016b で導入