ClassificationPartitionedModel

交差検証分類モデル

説明

ClassificationPartitionedModel は、交差検証分割で学習させた一連の分類モデルです。"kfold" メソッド kfoldPredict、kfoldLoss、kfoldMargin、kfoldEdge、kfoldfun の 1 つ以上を使用した交差検証によって分類の品質を推定します。

すべての "kfold" メソッドでは、学習用データの観測値で学習したモデルを使用して、学習用データにはない観測値に対する応答を予測します。たとえば、データを 5 つに分割して交差検証を行うとします。この場合、ほぼ等しいサイズの 5 つのグループに各観測値が無作為に割り当てられます。"学習分割" にグループのうち 4 つ (すなわち、データの約 4/5) が含まれ、"テスト分割" に残りのグループ (すなわち、データの約 1/5) が含まれます。この場合、交差検証は次のように進めます。

CVMdl.Trained{1} に保存されている最初のモデルは、後の 4 グループの観測値によって学習され、最初のグループの観測値を検証用に確保します。
1 番目のグループと最後の 3 つのグループの観測値を使用して 2 番目のモデル (CVMdl.Trained{2} に格納) に学習させ、2 番目のグループの観測値を検証用に確保します。
3 番目～ 5 番目のモデルについて同様に続けます。

kfoldPredict を呼び出して検証する場合、最初のモデルを使用してグループ 1 の観測に対する予測が計算され、2 番目のモデルにはグループ 2 が計算され、以降同様です。つまり、それぞれの観測値に対する応答は、その観測値ではなく学習したモデルによって推定されます。

作成

説明

CVMdl = crossval(Mdl) は、分類モデル (Mdl) から交差検証分類モデルを作成します。

例

あるいは、次のようにします。

CVDiscrMdl = fitcdiscr(X,Y,Name,Value)
CVKNNMdl = fitcknn(X,Y,Name,Value)
CVNetMdl = fitcnet(X,Y,Name,Value)
CVNBMdl = fitcnb(X,Y,Name,Value)
CVSVMMdl = fitcsvm(X,Y,Name,Value)
CVTreeMdl = fitctree(X,Y,Name,Value)

これらは、Name が 'CrossVal'、'KFold'、'Holdout'、'Leaveout'、または 'CVPartition' のいずれかである場合に、その交差検証モデルを作成します。構文の詳細については、fitcdiscr、fitcknn、fitcnet、fitcnb、fitcsvm、および fitctree を参照してください。

入力引数

すべて展開する

`Mdl` — 分類モデル
`ClassificationTree` オブジェクト | `ClassificationDiscriminant` オブジェクト | `ClassificationNeuralNetwork` オブジェクト | `ClassificationNaiveBayes` オブジェクト | `ClassificationKNN` オブジェクト | `ClassificationSVM` オブジェクト

分類モデル。次のいずれかとして指定します。

fitctree を使用して学習させた分類木
fitcdiscr を使用して学習させた判別分析分類器
fitcnet を使用して学習させたニューラルネットワーク分類器
fitcnb を使用して学習させた単純ベイズ分類器
fitcknn を使用して学習させた最近傍分類器
fitcsvm を使用して学習させたサポートベクターマシン分類器

プロパティ

すべて展開する

`BinEdges` — 数値予測子のビンのエッジ
読み取り専用: p 個の数値ベクトルの cell 配列

このプロパティは読み取り専用です。

数値予測子のビンのエッジ。p 個の数値ベクトルが含まれている cell 配列を指定します。p は予測子の個数です。各ベクトルには、数値予測子のビンのエッジを含めます。カテゴリカル予測子はビン化されないので、カテゴリカル予測子の場合は、この cell 配列の要素を空にします。

数値予測子がビン化されるのは、木学習器を使用してモデルに学習をさせるときに名前と値の引数 NumBins として正の整数スカラーを指定した場合だけです。NumBins の値が空 (既定) である場合、BinEdges プロパティは空になります。

学習済みモデル mdl の BinEdges プロパティを使用することにより、ビン化された予測子データ Xbinned を再現できます。

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end

数値予測子の場合、1 からビンの数までの範囲にあるビンのインデックスが Xbinned に格納されます。カテゴリカル予測子の場合、Xbinned の値は 0 になります。X に NaN が含まれている場合、対応する Xbinned の値は NaN になります。

データ型: cell

`CategoricalPredictors` — カテゴリカル予測子のインデックス
正の整数のベクトル | `[]`

カテゴリカル予測子のインデックス。正の整数のベクトルとして指定します。CategoricalPredictors には、対応する予測子がカテゴリカルであることを示すインデックス値が格納されます。インデックス値の範囲は 1 ～ p です。p はモデルの学習に使用した予測子の数です。どの予測子もカテゴリカルではない場合、このプロパティは空 ([]) になります。

Mdl が学習済みの判別分析分類器の場合、CategoricalPredictors は常に空 ([]) になります。

データ型: single | double

`ClassNames` — 一意のクラスラベル
読み取り専用: categorical 配列 | 文字配列 | logical ベクトル | 数値ベクトル | 文字ベクトルの cell 配列

このプロパティは読み取り専用です。

学習で使用する一意なクラスラベル。categorical 配列、文字配列、logical ベクトル、数値ベクトル、または文字ベクトルの cell 配列を指定します。ClassNames のデータ型はクラスラベル Y と同じです。(string 配列は文字ベクトルの cell 配列として扱われます)。ClassNames はクラスの順序も決定します。

`Cost` — 誤分類のコスト
正方数値行列

正方行列。Cost(i,j) は真のクラスが i である場合に 1 つの点をクラス j に分類するためのコストです (行は真のクラス、列は予測したクラスに対応します)。Cost の行と列の順序は、ClassNames のクラスの順序に対応します。Cost の行および列の数は、応答に含まれている一意なクラスの数です。

CVModel が交差検証済みの ClassificationDiscriminant モデル、ClassificationKNN モデル、ClassificationNaiveBayes モデル、または ClassificationNeuralNetwork モデルの場合、ドット表記を使用してコスト行列を変更できます。たとえば、CostMatrix の場合は次のようになります。

CVModel.Cost = CostMatrix;

データ型: double

`CrossValidatedModel` — 交差検証済みモデルの名前
読み取り専用: 文字ベクトル

このプロパティは読み取り専用です。

交差検証済みモデルの名前。文字ベクトルとして返されます。

データ型: char

`KFold` — モデルの分割の数
正の整数

交差検証モデルの分割の数。正の整数として返されます。

データ型: double

`ModelParameters` — 交差検証済みモデルのパラメーター
オブジェクト

交差検証済みモデルのパラメーター。オブジェクトとして返されます。

`NumObservations` — 学習データに含まれている観測値の数
読み取り専用: 正の整数

このプロパティは読み取り専用です。

学習データ内の観測値の数。正の整数として返されます。入力データまたは応答データに欠損値がある場合、NumObservations は入力データの行数よりも少なくなることがあります。

データ型: double

`Partition` — 交差検証で使用される分割
読み取り専用: `CVPartition` オブジェクト

このプロパティは読み取り専用です。

交差検証で使用される分割。CVPartition オブジェクトとして返されます。

`PredictorNames` — 予測子名
読み取り専用: 文字ベクトルの cell 配列

このプロパティは読み取り専用です。

予測子データ X に現れる順序で並んでいる予測子名。文字ベクトルの cell 配列を指定します。PredictorNames の長さは、X の列数と同じです。

データ型: cell

`Prior` — 各クラスの事前確率
数値ベクトル

各クラスの事前確率。数値ベクトルとして返されます。Prior の要素の順序は、ClassNames のクラスの順序に対応します。

CVModel が交差検証済みの ClassificationDiscriminant モデルまたは ClassificationNaiveBayes モデルの場合、ドット表記を使用して事前確率のベクトルを変更できます。たとえば、priorVector をクラス数と同じ長さのベクトルとすると次のようになります。

CVModel.Prior = priorVector;

データ型: double

`ResponseName` — 応答変数名
文字ベクトル

応答変数名。文字ベクトルを指定します。

データ型: char

`ScoreTransform` — スコア変換関数
関数名 | 関数ハンドル

スコア変換。文字ベクトルまたは関数ハンドルを指定します。ScoreTransform は、組み込みの変換関数または予測した分類スコアを変換する関数のハンドルを表します。

スコア変換関数を function などに変更するには、ドット表記を使用します。

組み込み関数の場合は、文字ベクトルを入力します。

Mdl.ScoreTransform = 'function';

次の表は、使用可能な組み込み関数の一覧です。

値	説明
`'doublelogit'`	1/(1 + e^–2x)
`'invlogit'`	log(x / (1 – x))
`'ismax'`	最大のスコアをもつクラスのスコアを 1 に設定し、他のすべてのクラスのスコアを 0 に設定する
`'logit'`	1/(1 + e^–x)
`'none'` または `'identity'`	x (変換なし)
`'sign'`	x < 0 のとき –1 x = 0 のとき 0 x > 0 のとき 1
`'symmetric'`	2x – 1
`'symmetricismax'`	最大のスコアをもつクラスのスコアを 1 に設定し、他のすべてのクラスのスコアを –1 に設定する
`'symmetriclogit'`	2/(1 + e^–x) – 1

MATLAB^® 関数やユーザー定義関数の場合は、関数ハンドルを入力します。
```
Mdl.ScoreTransform = @function;
```
function は、行列 (元のスコア) を受け入れて同じサイズの行列 (変換したスコア) を返さなければなりません。

データ型: char | string | function_handle

`Trained` — 学習済みの学習器
コンパクトな分類モデルの cell 配列

学習済みの学習器。交差検証分割で学習させたコンパクトな分類モデルの cell 配列として返されます。

`W` — モデル内のスケーリングされた重み
読み取り専用: 数値ベクトル

このプロパティは読み取り専用です。

モデル内のスケーリングされた重み。数値ベクトルとして返されます。W の長さは n (学習データの行数) です。

データ型: double

`X` — 予測子の値
読み取り専用: 実数行列 | table

このプロパティは読み取り専用です。

予測子の値。実数行列または table として返されます。X の各列が 1 つの変数 (予測子) を表し、各行が 1 つの観測値を表します。

データ型: double | table

`Y` — クラスラベル
読み取り専用: categorical 配列 | 文字ベクトルの cell 配列 | 文字配列 | logical ベクトル | 数値ベクトル

このプロパティは読み取り専用です。

X の観測値に対応するクラスラベル。categorical 配列、文字ベクトルの cell 配列、文字配列、logical ベクトル、または数値ベクトルとして返されます。Y の各行は、X の対応する行の分類を表します。

オブジェクト関数

`gather`	Gather properties of Statistics and Machine Learning Toolbox object from GPU
`kfoldEdge`	交差検証済み分類モデルの分類エッジ
`kfoldLoss`	交差検証済み分類モデルの分類損失
`kfoldMargin`	交差検証済み分類モデルの分類マージン
`kfoldPredict`	交差検証済み分類モデルの観測値の分類
`kfoldfun`	分類での関数の交差検証

例

すべて折りたたむ

分類木分類器の分類誤差の評価

ライブスクリプトを開く

分類木モデルの "k" 分割交差検証誤差を評価します。

フィッシャーのアヤメのデータセットを読み込みます。

load fisheriris

既定のオプションを使用して分類木に学習させます。

Mdl = fitctree(meas,species);

分類木モデルを交差検証します。

CVMdl = crossval(Mdl);

10 分割交差検証損失を推定します。

L = kfoldLoss(CVMdl)

L = 
0.0533

テスト標本の事後確率の推定

ライブスクリプトを開く

SVM アルゴリズムのテストセットの陽性クラス事後確率を推定します。

ionosphere データセットを読み込みます。

load ionosphere

SVM 分類器を学習させます。20% のホールドアウト標本を指定します。予測子を標準化してクラスの順序を指定することをお勧めします。

rng(1) % For reproducibility
CVSVMModel = fitcsvm(X,Y,'Holdout',0.2,'Standardize',true,...
    'ClassNames',{'b','g'});

CVSVMModel は学習させた ClassificationPartitionedModel 交差検証分類器です。

観測スコアを、'g' として分類される観測の事後確率にマッピングするために最適なスコア関数を推定します。

ScoreCVSVMModel = fitSVMPosterior(CVSVMModel);

ScoreSVMModel は学習させた ClassificationPartitionedModel 交差検証分類器で、学習データから推定された最適スコア変換関数が含まれます。

標本外の陽性クラス事後確率を推定します。最初の 10 件の標本外観測の結果を表示します。

[~,OOSPostProbs] = kfoldPredict(ScoreCVSVMModel);
indx = ~isnan(OOSPostProbs(:,2));
hoObs = find(indx); % Holdout observation numbers
OOSPostProbs = [hoObs, OOSPostProbs(indx,2)];
table(OOSPostProbs(1:10,1),OOSPostProbs(1:10,2),...
    'VariableNames',{'ObservationIndex','PosteriorProbability'})

ans=10×2 table
    ObservationIndex    PosteriorProbability
    ________________    ____________________

            6                   0.17375     
            7                   0.89638     
            8                 0.0076573     
            9                   0.91602     
           16                  0.026709     
           22                4.6069e-06     
           23                   0.90241     
           24                2.4119e-06     
           38                0.00042666     
           41                   0.86429

ヒント

学習済みの交差検証 SVM 分類器の事後確率を推定するには、fitSVMPosterior を使用します。

拡張機能

すべて展開する

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

使用上の注意および制限:

ClassificationPartitionedModel は、次の交差検証モデルオブジェクトのいずれかになります。
- fitcknn で学習させた k 最近傍分類器
- fitcsvm で学習させたサポートベクターマシン分類器
- fitctree で学習させたマルチクラス分類用の二分決定木
- fitcnet で学習させた分類用のニューラルネットワーク
ClassificationPartitionedModel モデルのオブジェクト関数は GPU 配列を完全にサポートしています。

詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2011a で導入

すべて展開する

R2024b: `ClassificationNeuralNetwork` モデルに対する GPU 配列の指定 (Parallel Computing Toolbox が必要)

ClassificationPartitionedModel で ClassificationNeuralNetwork モデルの GPU 配列が完全にサポートされます。

R2023a: ニューラルネットワーク分類器での誤分類コストと事前確率のサポート

fitcnet でニューラルネットワーク分類器の誤分類コストと事前確率がサポートされます。モデルを作成するときに、名前と値の引数 Cost および Prior を指定します。あるいは、モデルに学習させた後に誤分類コストを指定するには、ドット表記を使用して Cost プロパティの値を変更できます。

Mdl.Cost = [0 2; 1 0];

R2022a: `Cost` プロパティにユーザー指定のコスト行列を格納

R2022a 以降では、指定したコストの値を使用して観測誤分類コストを計算できるように、交差検証 SVM 分類モデルの Cost プロパティにユーザー指定のコスト行列が格納されます。ソフトウェアで格納される正規化された事前確率 (Prior) と観測値の重み (W) には、コスト行列で指定されているペナルティは反映されていません。他の交差検証モデルは既にこの動作になっています。観測誤分類コストを計算するには、関数 kfoldLoss を呼び出すときに名前と値の引数 LossFun を "classifcost" として指定します。

モデルの学習は変更されていないため、クラス間の判定境界には変更がないことに注意してください。

SVM モデルの学習用に、指定した事前確率が近似関数によって更新され、指定したコスト行列で指定されているペナルティが組み込まれます。さらに、事前確率と観測値の重みが正規化されます。この動作は変更されていません。以前のリリースでは、Cost プロパティには既定のコスト行列が格納され、Prior プロパティと W プロパティには学習に使用される事前確率と観測値の重みがそれぞれ格納されていました。R2022a 以降では、ユーザー指定のコスト行列が変更なしで格納され、コストのペナルティが反映されていない正規化された事前確率と観測値の重みが格納されます。詳細については、誤分類コスト行列、事前確率、および観測値の重みを参照してください。

Cost プロパティと W プロパティを使用するオブジェクト関数の一部を次に示します。

関数 kfoldLoss は、名前と値の引数 LossFun を "classifcost" または "mincost" として指定した場合、Cost プロパティに格納されたコスト行列を使用します。
関数 kfoldLoss および kfoldEdge は、W プロパティに格納された観測値の重みを使用します。

分類モデルに学習させるときに既定以外のコスト行列を指定すると、オブジェクト関数で以前のリリースとは異なる値が返されます。

ソフトウェアでコスト行列、事前確率、および観測値の重みを以前のリリースと同じように扱う場合は、誤分類コスト行列に応じた事前確率と観測値の重みの調整の説明に従って、既定以外のコスト行列の事前確率と観測値の重みを調整します。その後、分類モデルに学習させるときに、調整後の事前確率と観測値の重みを名前と値の引数 Prior と Weights を使用して指定し、既定のコスト行列を使用します。

参考

トピック

判別分析分類器の交差検証

ClassificationPartitionedModel

説明

作成

説明

入力引数

Mdl — 分類モデル ClassificationTree オブジェクト | ClassificationDiscriminant オブジェクト | ClassificationNeuralNetwork オブジェクト | ClassificationNaiveBayes オブジェクト | ClassificationKNN オブジェクト | ClassificationSVM オブジェクト

プロパティ

BinEdges — 数値予測子のビンのエッジ 読み取り専用: p 個の数値ベクトルの cell 配列

CategoricalPredictors — カテゴリカル予測子のインデックス 正の整数のベクトル | []

ClassNames — 一意のクラス ラベル 読み取り専用: categorical 配列 | 文字配列 | logical ベクトル | 数値ベクトル | 文字ベクトルの cell 配列

Cost — 誤分類のコスト 正方数値行列

CrossValidatedModel — 交差検証済みモデルの名前 読み取り専用: 文字ベクトル

KFold — モデルの分割の数 正の整数

ModelParameters — 交差検証済みモデルのパラメーター オブジェクト

NumObservations — 学習データに含まれている観測値の数 読み取り専用: 正の整数

Partition — 交差検証で使用される分割 読み取り専用: CVPartition オブジェクト

PredictorNames — 予測子名 読み取り専用: 文字ベクトルの cell 配列

Prior — 各クラスの事前確率 数値ベクトル

ResponseName — 応答変数名 文字ベクトル

ScoreTransform — スコア変換関数 関数名 | 関数ハンドル

Trained — 学習済みの学習器 コンパクトな分類モデルの cell 配列

W — モデル内のスケーリングされた重み 読み取り専用: 数値ベクトル

X — 予測子の値 読み取り専用: 実数行列 | table

Y — クラス ラベル 読み取り専用: categorical 配列 | 文字ベクトルの cell 配列 | 文字配列 | logical ベクトル | 数値ベクトル

オブジェクト関数

例

分類木分類器の分類誤差の評価

テスト標本の事後確率の推定

ヒント

拡張機能

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

バージョン履歴

R2024b: ClassificationNeuralNetwork モデルに対する GPU 配列の指定 (Parallel Computing Toolbox が必要)

R2023a: ニューラル ネットワーク分類器での誤分類コストと事前確率のサポート

R2022a: Cost プロパティにユーザー指定のコスト行列を格納

参考

トピック

`Mdl` — 分類モデル
`ClassificationTree` オブジェクト | `ClassificationDiscriminant` オブジェクト | `ClassificationNeuralNetwork` オブジェクト | `ClassificationNaiveBayes` オブジェクト | `ClassificationKNN` オブジェクト | `ClassificationSVM` オブジェクト

`BinEdges` — 数値予測子のビンのエッジ
読み取り専用: p 個の数値ベクトルの cell 配列

`CategoricalPredictors` — カテゴリカル予測子のインデックス
正の整数のベクトル | `[]`

`ClassNames` — 一意のクラスラベル
読み取り専用: categorical 配列 | 文字配列 | logical ベクトル | 数値ベクトル | 文字ベクトルの cell 配列

`Cost` — 誤分類のコスト
正方数値行列

`CrossValidatedModel` — 交差検証済みモデルの名前
読み取り専用: 文字ベクトル

`KFold` — モデルの分割の数
正の整数

`ModelParameters` — 交差検証済みモデルのパラメーター
オブジェクト

`NumObservations` — 学習データに含まれている観測値の数
読み取り専用: 正の整数

`Partition` — 交差検証で使用される分割
読み取り専用: `CVPartition` オブジェクト

`PredictorNames` — 予測子名
読み取り専用: 文字ベクトルの cell 配列

`Prior` — 各クラスの事前確率
数値ベクトル

`ResponseName` — 応答変数名
文字ベクトル

`ScoreTransform` — スコア変換関数
関数名 | 関数ハンドル

`Trained` — 学習済みの学習器
コンパクトな分類モデルの cell 配列

`W` — モデル内のスケーリングされた重み
読み取り専用: 数値ベクトル

`X` — 予測子の値
読み取り専用: 実数行列 | table

`Y` — クラスラベル
読み取り専用: categorical 配列 | 文字ベクトルの cell 配列 | 文字配列 | logical ベクトル | 数値ベクトル

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

R2024b: `ClassificationNeuralNetwork` モデルに対する GPU 配列の指定 (Parallel Computing Toolbox が必要)

R2023a: ニューラルネットワーク分類器での誤分類コストと事前確率のサポート

R2022a: `Cost` プロパティにユーザー指定のコスト行列を格納