Main Content

setdiff

2 つの配列の差集合

説明

C = setdiff(A,B) は、B にない A のデータを繰り返さずに返します。C は並べ替えた順序になります。

  • AB が table または timetable の場合、setdiff は、A の行のうち B に含まれない行を返します。timetable の場合、setdiff は行時間を考慮して等価性を判別し、出力 timetable C を行時間で並べ替えます。

C = setdiff(A,B,setOrder) は、特定の順序で C を返します。setOrder には 'sorted' または 'stable' を指定できます。

C = setdiff(A,B,___,'rows')C = setdiff(A,B,'rows',___) は、AB の各行を 1 つのエンティティとして扱い、B に存在しない A の行を繰り返さずに返します。AB は必ず指定しなければなりません。setOrder はオプションで指定できます。

入力がいずれも categorical 配列または datetime 配列でない場合、'rows' オプションは cell 配列をサポートしません。

また、[C,ia] = setdiff(___) は前述の構文のいずれかを使用してインデックス ベクトル ia を返します。

  • 通常は C = A(ia) です。

  • 'rows' オプションが指定されている場合、C = A(ia,:) です。

  • A または B が table または timetable の場合、C = A(ia,:) です。

[C,ia] = setdiff(A,B,'legacy')[C,ia] = setdiff(A,B,'rows','legacy') は、R2012b およびそれ以前のリリースの関数 setdiff の動作を保持します。

'legacy' オプションは categorical 配列、datetime 配列、duration 配列、table または timetable をサポートしません。

すべて折りたたむ

共通の値をもつ 2 つのベクトルを定義します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];

B 内になく A 内にある値を検索します。

C = setdiff(A,B)
C = 1×3

     1     3     5

共通の行をもつ 2 つのテーブルを定義します。

A = table([1:5]',['A';'B';'C';'D';'E'],logical([0;1;0;1;0]))
A=5×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     1       A      false
     2       B      true 
     3       C      false
     4       D      true 
     5       E      false

B = table([1:2:10]',['A';'C';'E';'G';'I'],logical(zeros(5,1)))
B=5×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     1       A      false
     3       C      false
     5       E      false
     7       G      false
     9       I      false

B 内になく A 内にある行を求めます。

C = setdiff(A,B)
C=2×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     2       B      true 
     4       D      true 

共通の値をもつ 2 つのベクトルを定義します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];

B になく A にある値と、C = A(ia) となるインデックス ベクトル ia を求めます。

[C,ia] = setdiff(A,B)
C = 1×3

     1     3     5

ia = 3×1

     4
     1
     5

5 人の性別、年齢および身長の table A を定義します。

A = table(['M';'M';'F';'M';'F'],[27;52;31;46;35],[74;68;64;61;64],...
'VariableNames',{'Gender' 'Age' 'Height'},...
'RowNames',{'Ted' 'Fred' 'Betty' 'Bob' 'Judy'})
A=5×3 table
             Gender    Age    Height
             ______    ___    ______

    Ted        M       27       74  
    Fred       M       52       68  
    Betty      F       31       64  
    Bob        M       46       61  
    Judy       F       35       64  

A と同じ変数をもつ table B を定義します。

B = table(['F';'M';'F';'F'],[64;68;62;58],[31;47;35;23],...
'VariableNames',{'Gender' 'Height' 'Age'},...
'RowNames',{'Meg' 'Joe' 'Beth' 'Amy'})
B=4×3 table
            Gender    Height    Age
            ______    ______    ___

    Meg       F         64      31 
    Joe       M         68      47 
    Beth      F         62      35 
    Amy       F         58      23 

B になく A にある行と、C = A(ia,:) となるインデックス ベクトル ia を求めます。

[C,ia] = setdiff(A,B)
C=4×3 table
            Gender    Age    Height
            ______    ___    ______

    Judy      F       35       64  
    Ted       M       27       74  
    Bob       M       46       61  
    Fred      M       52       68  

ia = 4×1

     5
     1
     4
     2

C の行は、最初に Gender、その次に Age による並べ替え順になります。

共通の行をもつ 2 つの行列を定義します。

A = [7 9 7; 0 0 0; 7 9 7; 5 5 5; 1 4 5];
B = [0 0 0; 5 5 5];

B になく A にある行と、C = A(ia,:) となるインデックス ベクトル ia を求めます。

[C,ia] = setdiff(A,B,'rows')
C = 2×3

     1     4     5
     7     9     7

ia = 2×1

     5
     1

setOrder 引数を使って C の値の順序を指定します。

C 内の値の順序が重要なときには、'stable' または 'sorted' を指定します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];
[C,ia] = setdiff(A,B,'stable')
C = 1×3

     3     1     5

ia = 3×1

     1
     4
     5

または、関数 'sorted' を指定できます。

 [C,ia] = setdiff(A,B,'sorted')
C = 1×3

     1     3     5

ia = 3×1

     4
     1
     5

NaN を含む 2 つのベクトルを定義します。

A = [5 NaN NaN]; 
B = [5 NaN];

AB の差集合を検索します。

C = setdiff(A,B)
C = 1×2

   NaN   NaN

setdiffNaN 値を個別のものとして処理します。

文字ベクトルの cell 配列 A を作成します。

A = {'dog','cat','fish','horse'};

文字ベクトルの cell 配列 B を作成します。一部のベクトルは末尾に空白文字があります。

B = {'dog ','cat','fish ','horse'};

B にない A の文字ベクトルを見つけます。

[C,ia] = setdiff(A,B)
C = 1x2 cell
    {'dog'}    {'fish'}

ia = 2×1

     1
     3

setdiff は、文字ベクトルの cell 配列内の末尾の空白文字を別個の文字として処理します。

文字ベクトル A を作成します。

A = ['cat';'dog';'fox';'pig'];
class(A)
ans = 
'char'

文字ベクトルの cell 配列 B を作成します。

B={'dog','cat','fish','horse'};
class(B)
ans = 
'cell'

B にない A の文字ベクトルを見つけます。

C = setdiff(A,B)
C = 2x1 cell
    {'fox'}
    {'pig'}

結果の C は、文字ベクトルの cell 配列になります。

class(C)
ans = 
'cell'

'legacy' フラグを使用して、コード内の R2012b およびそれ以前のリリースの setdiff の動作を保持します。

現在の動作における AB の差を検出します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];
[C1,ia1] = setdiff(A,B)
C1 = 1×3

     1     3     5

ia1 = 3×1

     4
     1
     5

AB の差を検出し、レガシ動作を維持します。

[C2,ia2] = setdiff(A,B,'legacy')
C2 = 1×3

     1     3     5

ia2 = 1×3

     7     1     5

入力引数

すべて折りたたむ

入力配列。'rows' オプションを指定する場合、AB の列数は同じでなければなりません。

A および B は次の例外を伴う同一クラスに属していなければなりません。

  • logicalchar、およびすべての数値クラスは double 配列と組み合わせることができます。

  • 文字ベクトルの cell 配列は、文字配列または string 配列と組み合わせることができます。

  • categorical 配列は、文字配列、文字ベクトルの cell 配列または string 配列と組み合わせることができます。

  • datetime 配列は、日付文字ベクトルの cell 配列または単一の日付文字ベクトルと組み合わせることができます。

AB には、データ型に基づく追加の要件があります。

  • AB の両方が順序 categorical 配列である場合は、順序を含めて同じカテゴリ セットでなければなりません。AB の両方が順序配列でない場合、同じカテゴリ セットをもつ必要はなく、カテゴリ名を使用して比較が実行されます。この場合、C のカテゴリは、A のカテゴリの後に A にない B のカテゴリを並べて構成されます。カテゴリの順序は A および B と同じでなければならず、そのカテゴリの順序が C の並べ替えに使用されます。

  • AB が table または timetable の場合、その変数名は同じでなければなりません (順序は除く)。table の場合、行名は無視されるため、値が同じで名前が異なる 2 つの行は等しいと見なされます。timetable の場合、行時間が考慮されるため、値が同じで時間が異なる 2 つの行は、等しくないと見なされます。

  • AB が datetime 配列の場合、タイム ゾーンの指定が互いに一貫していなければなりません。

また、A および B は次のクラス メソッドをもつオブジェクトにすることもできます。

  • sort (または 'rows' オプションの sortrows)

  • eq

  • ne

オブジェクト クラスのメソッドは、相互に一貫していなければなりません。これらのオブジェクトは、同じルート クラスから導出した異種混合配列を含みます。たとえば、A および B はグラフィックス オブジェクトのハンドルの配列にすることができます。

'sorted' または 'stable' として指定される順序フラグは、C で値 (または行) の順序を示します。

フラグ説明
'sorted'

C の値 (または行) は、sort により返されるような並べ替えられた順序で返されます。

C = setdiff([4 1 3 2 5],[2 1],'sorted')
C =

     3     4     5

'stable'

C の値 (または行) は A と同じ順序で返されます。

C = setdiff([4 1 3 2 5],[2 1],'stable')
C =

     4     3     5

データ型: char | string

出力引数

すべて折りたたむ

AB の差。ベクトル、行列、table または timetable として返されます。入力 A および B が table または timetable の場合、C の変数の順番は、A の変数の順番と同じになります。

入力がベクトルまたは行列で、'legacy' フラグを指定していないときの C の形状を次に説明します。

  • 'rows' フラグを指定しておらず、A が行ベクトルの場合、C は行ベクトルです。

  • 'rows' フラグを指定しておらず、A が行ベクトルでない場合、C は列ベクトルです。

  • 'rows' を指定した場合、C は、B には含まれない A の行を含む行列です。

  • A のすべての値 (または行) が B にも存在する場合、C は空行列です。

C のクラスは、以下の場合を除き、A のクラスと同じです。

  • A が文字配列で、B が文字ベクトルの cell 配列の場合、C は文字ベクトルの cell 配列です。

  • A が文字ベクトル、文字ベクトルの cell 配列または string で、B が categorical 配列の場合、C は categorical 配列です。

  • A が文字ベクトルの cell 配列または単一の文字ベクトルで、B が datetime 配列の場合、C は datetime 配列です。

  • A が文字ベクトルまたは文字ベクトルの cell 配列で、B が string 配列の場合、C は string 配列です。

'legacy' フラグを指定していないときに列ベクトルとして返される、A へのインデックス。iaは、B と共通でない、A 内の値 (または行) を特定します。A 内だけに出現する繰り返しの値 (または行) がある場合、ia は値 (または行) の最初の出現位置に対するインデックスを含みます。

ヒント

  • table または timetable の変数のサブセットに関する差集合を求めるには、列の添字を使用できます。たとえば、setdiff(A(:,vars),B(:,vars)) を使用できます。ここで、vars は、正の整数、正の整数のベクトル、変数名、変数名の cell 配列または logical ベクトルです。あるいは vartype を使用して、指定したタイプの変数を選択する添字を作成することもできます。

拡張機能

バージョン履歴

R2006a より前に導入