setdiff

2 つのデータセットの差分

ページ内をすべて折りたたむ

構文

C = setdiff(A,B)

C = setdiff(A,B,setOrder)

C = setdiff(A,B,___,'rows')

C = setdiff(A,B,'rows',___)

[C,ia] = setdiff(___)

[C,ia] = setdiff(A,B,'legacy')

[C,ia] = setdiff(A,B,'rows','legacy')

説明

C = setdiff(A,B) は、B にない A のデータを繰り返さずに返します。C は並べ替えた順序になります。

A と B が table または timetable の場合、setdiff は、A の行のうち B に含まれない行を返します。timetable の場合、setdiff は行時間を考慮して等価性を判別し、出力 timetable C を行時間で並べ替えます。

例

C = setdiff(A,B,setOrder) は、特定の順序で C を返します。setOrder には 'sorted' または 'stable' を指定できます。

例

C = setdiff(A,B,___,'rows') と C = setdiff(A,B,'rows',___) は、A と B の各行を 1 つのエンティティとして扱い、B に存在しない A の行を繰り返さずに返します。A と B は必ず指定しなければなりません。setOrder はオプションで指定できます。

入力がいずれも categorical 配列または datetime 配列でない場合、'rows' オプションは cell 配列をサポートしません。

また、[C,ia] = setdiff(___) は前述の構文のいずれかを使用してインデックスベクトル ia を返します。

通常は C = A(ia) です。
'rows' オプションが指定されている場合、C = A(ia,:) です。
A または B が table または timetable の場合、C = A(ia,:) です。

例

[C,ia] = setdiff(A,B,'legacy') と [C,ia] = setdiff(A,B,'rows','legacy') は、R2012b およびそれ以前のリリースの関数 setdiff の動作を保持します。

'legacy' オプションは categorical 配列、datetime 配列、duration 配列、table または timetable をサポートしません。

例

すべて折りたたむ

2 つのベクトルの差

ライブスクリプトを開く

共通の値をもつ 2 つのベクトルを定義します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];

B 内になく A 内にある値を検索します。

C = setdiff(A,B)

C = 1×3

     1     3     5

2 つのテーブルの差

ライブスクリプトを開く

共通の行をもつ 2 つのテーブルを定義します。

A = table([1:5]',["A";"B";"C";"D";"E"],logical([0;1;0;1;0]))

A=5×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     1      "A"     false
     2      "B"     true 
     3      "C"     false
     4      "D"     true 
     5      "E"     false

B = table([1:2:10]',["A";"C";"E";"G";"I"],logical(zeros(5,1)))

B=5×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     1      "A"     false
     3      "C"     false
     5      "E"     false
     7      "G"     false
     9      "I"     false

B 内になく A 内にある行を求めます。

C = setdiff(A,B)

C=2×3 table
    Var1    Var2    Var3 
    ____    ____    _____

     2      "B"     true 
     4      "D"     true

2 つのベクトルの差と異なる値へのインデックス

ライブスクリプトを開く

共通の値をもつ 2 つのベクトルを定義します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];

B になく A にある値と、C = A(ia) となるインデックスベクトル ia を求めます。

[C,ia] = setdiff(A,B)

C = 1×3

     1     3     5

2 つのテーブルの差と異なる行へのインデックス

ライブスクリプトを開く

5 人の人物の喫煙状況、年齢、身長の table A を定義します。

A = table([true;true;false;true;false],[27;52;31;46;35],[74;68;64;61;64], ...
VariableNames=["Smoker" "Age" "Height"], ...
RowNames=["Sanchez" "Brown" "Wu" "Murphy" "Johnson"])

A=5×3 table
               Smoker    Age    Height
               ______    ___    ______

    Sanchez    true      27       74  
    Brown      true      52       68  
    Wu         false     31       64  
    Murphy     true      46       61  
    Johnson    false     35       64

A と同じ変数をもつ table B を定義します。

B = table([false;true;false;false],[64;68;62;58],[31;47;35;23], ...
VariableNames=["Smoker" "Height" "Age"], ...
RowNames=["Smith" "Cheng" "Lee" "Jones"])

B=4×3 table
             Smoker    Height    Age
             ______    ______    ___

    Smith    false       64      31 
    Cheng    true        68      47 
    Lee      false       62      35 
    Jones    false       58      23

B になく A にある行と、C = A(ia,:) となるインデックスベクトル ia を求めます。値が同じで行名が異なる 2 つの行は、等しいと見なされます。したがって、Wu の A(3,:) と Smith の B(1,:) の行は等しくなります。どちらの行も出力 table C に含まれません。C の行は、最初に Smoker、その次に Age による並べ替え順になります。

[C,ia] = setdiff(A,B)

C=4×3 table
               Smoker    Age    Height
               ______    ___    ______

    Johnson    false     35       64  
    Sanchez    true      27       74  
    Murphy     true      46       61  
    Brown      true      52       68

2 つの行列の行の差

ライブスクリプトを開く

共通の行をもつ 2 つの行列を定義します。

A = [7 9 7; 0 0 0; 7 9 7; 5 5 5; 1 4 5];
B = [0 0 0; 5 5 5];

B になく A にある行と、C = A(ia,:) となるインデックスベクトル ia を求めます。

[C,ia] = setdiff(A,B,'rows')

C = 2×3

     1     4     5
     7     9     7

指定した出力順序の 2 つのベクトルの差

ライブスクリプトを開く

setOrder 引数を使って C の値の順序を指定します。

C 内の値の順序が重要なときには、'stable' または 'sorted' を指定します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];
[C,ia] = setdiff(A,B,'stable')

C = 1×3

     3     1     5

または、関数 'sorted' を指定できます。

 [C,ia] = setdiff(A,B,'sorted')

C = 1×3

     1     3     5

NaN を含むベクトルの差

ライブスクリプトを開く

NaN を含む 2 つのベクトルを定義します。

A = [5 NaN NaN]; 
B = [5 NaN];

A と B の差集合を検索します。

C = setdiff(A,B)

C = 1×2

   NaN   NaN

setdiff は NaN 値を個別のものとして処理します。

末尾が空白文字の文字ベクトルの cell 配列

ライブスクリプトを開く

文字ベクトルの cell 配列 A を作成します。

A = {'dog','cat','fish','horse'};

文字ベクトルの cell 配列 B を作成します。一部のベクトルは末尾に空白文字があります。

B = {'dog ','cat','fish ','horse'};

B にない A の文字ベクトルを見つけます。

[C,ia] = setdiff(A,B)

C = 1×2 cell
    {'dog'}    {'fish'}

setdiff は、文字ベクトルの cell 配列内の末尾の空白文字を別個の文字として処理します。

文字と文字ベクトルの cell 配列の差

ライブスクリプトを開く

文字ベクトル A を作成します。

A = ['cat';'dog';'fox';'pig'];
class(A)

ans = 
'char'

文字ベクトルの cell 配列 B を作成します。

B={'dog','cat','fish','horse'};
class(B)

ans = 
'cell'

B にない A の文字ベクトルを見つけます。

C = setdiff(A,B)

C = 2×1 cell
    {'fox'}
    {'pig'}

結果の C は、文字ベクトルの cell 配列になります。

class(C)

ans = 
'cell'

setdiff のレガシ動作の保持

ライブスクリプトを開く

'legacy' フラグを使用して、コード内の R2012b およびそれ以前のリリースの setdiff の動作を保持します。

現在の動作における A と B の差を検出します。

A = [3 6 2 1 5 1 1]; 
B = [2 4 6];
[C1,ia1] = setdiff(A,B)

C1 = 1×3

     1     3     5

A と B の差を検出し、レガシ動作を維持します。

[C2,ia2] = setdiff(A,B,'legacy')

C2 = 1×3

     1     3     5

ia2 = 1×3

     7     1     5

入力引数

すべて折りたたむ

`A,B` — 入力配列
配列

入力配列。'rows' オプションを指定する場合、A と B の列数は同じでなければなりません。

A および B は次の例外を伴う同一クラスに属していなければなりません。

logical、char、およびすべての数値クラスは double 配列と組み合わせることができます。
string 配列は、文字ベクトルおよび文字ベクトルの cell 配列と組み合わせることができます。
categorical 配列は、string スカラーおよび文字ベクトルと組み合わせることができます。
datetime 配列および duration 配列は、日付と時刻を表すように書式設定された string スカラーおよび文字ベクトルと組み合わせることができます。

A と B には、データ型に基づく追加の要件があります。

A と B の両方が順序 categorical 配列である場合は、順序を含めて同じカテゴリセットでなければなりません。A と B の両方が順序配列でない場合、同じカテゴリセットをもつ必要はなく、カテゴリ名を使用して比較が実行されます。この場合、C のカテゴリは、A のカテゴリの後に A にない B のカテゴリを並べて構成されます。カテゴリの順序は A および B と同じでなければならず、そのカテゴリの順序が C の並べ替えに使用されます。
A と B が table または timetable の場合、その変数名は同じでなければなりません (順序は除く)。table の場合、行名は無視されるため、値が同じで名前が異なる 2 つの行は等しいと見なされます。timetable の場合、行時間が考慮されるため、値が同じで時間が異なる 2 つの行は、等しくないと見なされます。
A と B が datetime 配列の場合、両方の配列でタイムゾーンを指定するか、両方ともゾーンなしにする必要があります。

また、A および B は次のクラスメソッドをもつオブジェクトにすることもできます。

sort (または 'rows' オプションの sortrows)
eq
ne

オブジェクトクラスのメソッドは、相互に一貫していなければなりません。これらのオブジェクトは、同じルートクラスから導出した異種混合配列を含みます。たとえば、A および B はグラフィックスオブジェクトのハンドルの配列にすることができます。

`setOrder` — 順序フラグ
`'sorted'` (既定値) | `'stable'`

'sorted' または 'stable' として指定される順序フラグは、C で値 (または行) の順序を示します。

フラグ説明

フラグ	説明
`'sorted'`	`C` の値 (または行) は、`sort` により返されるような並べ替えられた順序で返されます。例 C = setdiff([4 1 3 2 5],[2 1],'sorted') C = 3 4 5
`'stable'`	`C` の値 (または行) は `A` と同じ順序で返されます。例 C = setdiff([4 1 3 2 5],[2 1],'stable') C = 4 3 5

'sorted'

C の値 (または行) は、sort により返されるような並べ替えられた順序で返されます。

例

C = setdiff([4 1 3 2 5],[2 1],'sorted')

C =

     3     4     5

'stable'

C の値 (または行) は A と同じ順序で返されます。

例

C = setdiff([4 1 3 2 5],[2 1],'stable')

C =

     4     3     5

データ型: char | string

出力引数

すべて折りたたむ

`C` — `A` と `B` の差
ベクトル | 行列 | table | timetable

A と B の差。ベクトル、行列、table または timetable として返されます。入力 A および B が table または timetable の場合、C の変数の順番は、A の変数の順番と同じになります。

入力がベクトルまたは行列で、'legacy' フラグを指定していないときの C の形状を次に説明します。

'rows' フラグを指定しておらず、A が行ベクトルの場合、C は行ベクトルです。
'rows' フラグを指定しておらず、A が行ベクトルでない場合、C は列ベクトルです。
'rows' を指定した場合、C は、B には含まれない A の行を含む行列です。
A のすべての値 (または行) が B にも存在する場合、C は空行列です。

C のクラスは、以下の場合を除き、A のクラスと同じです。

A が文字配列で、B が文字ベクトルの cell 配列の場合、C は文字ベクトルの cell 配列です。
A が文字ベクトル、文字ベクトルの cell 配列または string で、B が categorical 配列の場合、C は categorical 配列です。
A が文字ベクトルの cell 配列または単一の文字ベクトルで、B が datetime 配列の場合、C は datetime 配列です。
A が文字ベクトルまたは文字ベクトルの cell 配列で、B が string 配列の場合、C は string 配列です。

`ia` — `A` のインデックス
列ベクトル

'legacy' フラグを指定していないときに列ベクトルとして返される、A へのインデックス。iaは、B と共通でない、A 内の値 (または行) を特定します。A 内だけに出現する繰り返しの値 (または行) がある場合、ia は値 (または行) の最初の出現位置に対するインデックスを含みます。

ヒント

table または timetable の変数のサブセットに関する差集合を求めるには、列の添字を使用できます。たとえば、setdiff(A(:,vars),B(:,vars)) を使用できます。ここで、vars は、正の整数、正の整数のベクトル、変数名、変数名の cell 配列または logical ベクトルです。あるいは vartype を使用して、指定したタイプの変数を選択する添字を作成することもできます。

拡張機能

すべて展開する

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

setdiff 関数は tall 配列をサポートしていますが、以下の使用上の注意および制限があります。

'stable' オプションおよび 'legacy' オプションはサポートされません。
'char' 型の入力はサポートされていません。
順序 categorical 配列はサポートされません。

詳細については、tall 配列を参照してください。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

使用上の注意および制限:

コード生成は最初および 2 番目の引数の cell 配列をサポートしません。
'rows' オプションを指定しない場合、以下の点に注意してください。
- 入力 A および B はベクトルでなければなりません。'legacy' オプションを指定した場合、入力 A および B は行ベクトルでなければなりません。
- 可変サイズの行ベクトルで最初の次元は固定長 1 でなければなりません。可変サイズの列ベクトルで 2 番目の次元は固定長 1 でなければなりません。
- [] を使用して空集合を表さないでください。1 行 0 列または 0 行 1 列の入力 (zeros(1,0) など) を使用して、空集合を表します。
- 'legacy' オプションを指定した場合、空の出力は 1 行 0 列の行ベクトルになります。0 行 0 列にはなりません。
'legacy' オプションと 'rows' オプションの両方を指定した場合、出力 ia は列ベクトルになります。ia が空の場合、0 行 1 列となります。0 行 0 列にはなりません。出力 C が 0 行 0 列であっても同様です。
setOrder が 'stable' ではないか、'legacy' オプションを指定した場合、入力はあらかじめ昇順で並べ替えられていなければなりません。最初の出力 C は、昇順で並べ替えられています。
複素数入力は、single または double でなければなりません。
一方の入力が複素数でもう一方の入力が実数の場合は、以下のいずれかを実行します。
- setOrder を 'stable' に設定します。
- 実数入力を複素数の昇順 (絶対値) で並べ替えます。実数入力が x と仮定します。sort(complex(x)) または sortrows(complex(x)) を使用します。
ゼロ値の虚数部をもつ複素数データのコード生成 (MATLAB Coder)を参照してください。

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

使用上の注意および制限については、「C/C++ コード生成」セクションを参照してください。GPU コード生成にも同様の、使用上の注意および制限が適用されます。

スレッドベースの環境
MATLAB® の `backgroundPool` を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の `ThreadPool` を使用してコードを高速化します。

setdiff 関数はスレッドベースの環境を完全にサポートしています。詳細については、スレッドベースの環境での MATLAB 関数の実行を参照してください。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

setdiff 関数は GPU 配列入力をサポートしますが、次の使用上の注意および制限があります。

'legacy' フラグはサポートされていません。
64 ビット整数はサポートされません。

詳細については、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

分散配列
Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。

setdiff 関数は分散配列をサポートしますが、次の使用上の注意および制限があります。

'legacy' フラグはサポートされていません。
table 入力、timetable 入力、categorical 入力、datetime 入力、duration 入力はサポートされていません。
A または B が文字ベクトルの cell 配列の場合、char 型と string 型の入力はサポートされていません。代わりに、文字ベクトル入力引数の cell 配列を string 配列に変換します。

詳細については、分散配列を使用した MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2006a より前に導入

参考

トピック

categorical 配列の結合

setdiff

構文

説明

例

2 つのベクトルの差

2 つのテーブルの差

2 つのベクトルの差と異なる値へのインデックス

2 つのテーブルの差と異なる行へのインデックス

2 つの行列の行の差

指定した出力順序の 2 つのベクトルの差

NaN を含むベクトルの差

末尾が空白文字の文字ベクトルの cell 配列

文字と文字ベクトルの cell 配列の差

setdiff のレガシ動作の保持

入力引数

A,B — 入力配列 配列

setOrder — 順序フラグ 'sorted' (既定値) | 'stable'

出力引数

C — A と B の差 ベクトル | 行列 | table | timetable

ia — A のインデックス 列ベクトル

ヒント

拡張機能

tall 配列 メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU コード生成 GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

スレッドベースの環境 MATLAB® の backgroundPool を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の ThreadPool を使用してコードを高速化します。

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

分散配列 Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。

バージョン履歴

参考

トピック

`A,B` — 入力配列
配列

`setOrder` — 順序フラグ
`'sorted'` (既定値) | `'stable'`

`C` — `A` と `B` の差
ベクトル | 行列 | table | timetable

`ia` — `A` のインデックス
列ベクトル

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

スレッドベースの環境
MATLAB® の `backgroundPool` を使用してバックグラウンドでコードを実行するか、Parallel Computing Toolbox™ の `ThreadPool` を使用してコードを高速化します。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

分散配列
Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。