predict

ガウスカーネル分類モデルのラベルの予測

ページ内をすべて折りたたむ

構文

Label = predict(Mdl,X)

[Label,Score] = predict(Mdl,X)

説明

Label = predict(Mdl,X) は、バイナリガウスカーネル分類モデル Mdl に基づいて、行列または table X 内の予測子データに対する予測クラスラベルのベクトルを返します。

例

[Label,Score] = predict(Mdl,X) は、両方のクラスの分類スコアも返します。

例

すべて折りたたむ

学習セットのラベルの予測

ライブスクリプトを開く

バイナリカーネル分類モデルを使用して学習セットのラベルを予測し、生成された分類の混同行列を表示します。

ionosphere データセットを読み込みます。このデータセットには、レーダー反射についての 34 個の予測子と、不良 ('b') または良好 ('g') という 351 個の二項反応が含まれています。

load ionosphere

レーダー反射が不良 ('b') と良好 ('g') のどちらであるかを識別するバイナリカーネル分類モデルに学習をさせます。

rng('default') % For reproducibility
Mdl = fitckernel(X,Y);

Mdl は ClassificationKernel モデルです。

学習セット (再代入) のラベルを予測します。

label = predict(Mdl,X);

混同行列を作成します。

ConfusionTrain = confusionchart(Y,label);

Figure contains an object of type ConfusionMatrixChart.

このモデルは、各クラスについて 1 つずつのレーダー反射を誤分類します。

テストセットのラベルの予測

ライブスクリプトを開く

バイナリカーネル分類モデルを使用してテストセットのラベルを予測し、生成された分類の混同行列を表示します。

load ionosphere

データセットを学習セットとテストセットに分割します。テストセット用に 15% のホールドアウト標本を指定します。

rng('default') % For reproducibility
Partition = cvpartition(Y,'Holdout',0.15);
trainingInds = training(Partition); % Indices for the training set
testInds = test(Partition); % Indices for the test set

学習セットを使用してバイナリカーネル分類モデルに学習をさせます。クラスの順序を定義することをお勧めします。

Mdl = fitckernel(X(trainingInds,:),Y(trainingInds),'ClassNames',{'b','g'});

学習セットのラベルとテストセットのラベルを予測します。

labelTrain = predict(Mdl,X(trainingInds,:));
labelTest = predict(Mdl,X(testInds,:));

学習セットの混同行列を作成します。

ConfusionTrain = confusionchart(Y(trainingInds),labelTrain);

Figure contains an object of type ConfusionMatrixChart.

このモデルは、各クラスについて 1 つずつのレーダー反射のみを誤分類します。

テストセットの混同行列を作成します。

ConfusionTest = confusionchart(Y(testInds),labelTest);

Figure contains an object of type ConfusionMatrixChart.

このモデルは、1 つの不良なレーダー反射を良好な反射として、5 つの良好なレーダー反射を不良な反射として誤分類します。

事後クラス確率の推定

ライブスクリプトを開く

テストセットの事後クラス確率を推定し、受信者動作特性 (ROC) 曲線をプロットしてモデルの品質を判断します。カーネル分類モデルは、ロジスティック回帰学習器の場合のみ事後確率を返します。

load ionosphere

データセットを学習セットとテストセットに分割します。テストセット用に 30% のホールドアウト標本を指定します。

rng('default') % For reproducibility
Partition = cvpartition(Y,'Holdout',0.30);
trainingInds = training(Partition); % Indices for the training set
testInds = test(Partition); % Indices for the test set

バイナリカーネル分類モデルに学習をさせます。ロジスティック回帰学習器を当てはめます。

Mdl = fitckernel(X(trainingInds,:),Y(trainingInds), ...
    'ClassNames',{'b','g'},'Learner','logistic');

テストセットの事後クラス確率を予測します。

[~,posterior] = predict(Mdl,X(testInds,:));

Mdl 内の正則化強度は 1 つなので、出力 posterior は列数が 2 で行数がテストセットの観測値数と同じである行列になります。列 i には、与えられた特定の観測値に対する Mdl.ClassNames(i) の事後確率が格納されます。

rocmetricsオブジェクトを作成し、ROC 曲線のパフォーマンスメトリクス (真陽性率と偽陽性率) を計算して ROC 曲線の下の領域 (AUC) の値を求めます。

rocObj = rocmetrics(Y(testInds),posterior,Mdl.ClassNames);

rocmetrics の関数 plot を使用して、2 番目のクラスの ROC 曲線をプロットします。

plot(rocObj,ClassNames=Mdl.ClassNames(2))

Figure contains an axes object. The axes object with title ROC Curve, xlabel False Positive Rate, ylabel True Positive Rate contains 3 objects of type roccurve, scatter, line. These objects represent g (AUC = 0.9042), g Model Operating Point.

AUC は 1 に近いので、モデルによるラベルの予測精度が高いことがわかります。

入力引数

すべて折りたたむ

`Mdl` — バイナリカーネル分類モデル
`ClassificationKernel` モデルオブジェクト

バイナリカーネル分類モデル。ClassificationKernel モデルオブジェクトを指定します。ClassificationKernel モデルオブジェクトは、fitckernel を使用して作成できます。

`X` — 分類対象の予測子データ
数値行列 | table

分類対象の予測子データ。数値行列または table を指定します。

X の各行は 1 つの観測値に対応し、各列は 1 つの変数に対応します。

数値行列の場合
- X の列に含まれている変数の順序は、Mdl に学習させた予測子変数の順序と同じでなければなりません。
- table (たとえば Tbl) を使用して Mdl に学習をさせた場合、Tbl に含まれている予測子変数がすべて数値変数であれば、X を数値行列にすることができます。学習時に Tbl 内の数値予測子をカテゴリカルとして扱うには、fitckernel の名前と値のペアの引数 CategoricalPredictors を使用してカテゴリカル予測子を指定します。Tbl に種類の異なる予測子変数 (数値および categorical データ型など) が混在し、X が数値行列である場合、predict でエラーがスローされます。
table の場合
- predict は、文字ベクトルの cell 配列ではない cell 配列や複数列の変数をサポートしません。
- table (たとえば Tbl) を使用して Mdl に学習をさせた場合、X 内のすべての予測子変数は変数名およびデータ型が、Mdl に学習させた (Mdl.PredictorNames に格納されている) 変数と同じでなければなりません。ただし、X の列の順序が Tbl の列の順序に対応する必要はありません。また、Tbl と X に追加の変数 (応答変数や観測値の重みなど) を含めることができますが、predict はこれらを無視します。
- 数値行列を使用して Mdl に学習をさせた場合、Mdl.PredictorNames 内の予測子名と X 内の対応する予測子変数名が同じでなければなりません。学習時に予測子の名前を指定する方法については、fitckernel の名前と値のペアの引数 PredictorNames を参照してください。X 内の予測子変数はすべて数値ベクトルでなければなりません。X に追加の変数 (応答変数や観測値の重みなど) を含めることができますが、predict はこれらを無視します。

データ型: table | double | single

出力引数

すべて折りたたむ

`Label` — 予測クラスラベル
categorical 配列 | 文字配列 | logical 行列 | 数値行列 | 文字ベクトルの cell 配列

予測クラスラベル。categorical 配列、文字配列、logical 行列、数値行列、または文字ベクトルの cell 配列として返されます。

Label の行数は n (n は X 内の観測値の個数)、データ型は Mdl の学習に使用した、観測されたクラスラベル (Y) と同じです。(string 配列は文字ベクトルの cell 配列として扱われます)。

関数 predict は、スコアが最高になるクラスに観測値を分類します。観測値のスコアが NaN の場合、関数はこの観測値を、学習ラベルの最大比率を占める多数クラスに分類します。

`Score` — 分類スコア
数値配列

分類スコア。n 行 2 列の数値配列として返されます。n は X 内の観測値の個数です。Score(i,j) は、観測値 i をクラス j に分類するスコアです。クラスの順序は Mdl.ClassNames に格納されます。

Mdl.Learner が 'logistic' の場合、分類スコアは事後確率です。

詳細

すべて折りたたむ

分類スコア

カーネル分類モデルの場合、観測値 x (行列ベクトル) を陽性クラスに分類する生の "分類スコア" は次のように定義されます。

$f (x) = T (x) β + b .$

$T (\cdot)$ は特徴量を拡張するための観測値の変換です。
β は推定された係数の列ベクトルです。
b は推定されたスカラーバイアスです。

x を陰性クラスに分類する生の分類スコアは −f(x) です。このソフトウェアでは、スコアが正になるクラスに観測値が分類されます。

カーネル分類モデルがロジスティック回帰学習器から構成されている場合、'logit' スコア変換が生の分類スコアに適用されます (ScoreTransform を参照)。

拡張機能

すべて展開する

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

predict 関数は、tall 配列を次の使用上の注意事項および制限事項付きでサポートします。

predict は tall table データをサポートしていません。

詳細は、tall 配列を参照してください。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。 (R2023a 以降)

使用上の注意および制限:

saveLearnerForCoder、loadLearnerForCoder および codegen (MATLAB Coder) を使用して、関数 predict のコードを生成します。saveLearnerForCoder を使用して、学習済みモデルを保存します。loadLearnerForCoder を使用して保存済みモデルを読み込んで関数 predict を呼び出す、エントリポイント関数を定義します。次に、codegen を使用して、エントリポイント関数のコードを生成します。
predict の単精度の C/C++ コードを生成するには、loadLearnerForCoder 関数を呼び出すときに DataType="single" を指定します。
Open Multiprocessing (OpenMP) ライブラリを使用している場合、コードジェネレーターで生成される predict のコードで予測子データ X が複数のチャンクに分割され、チャンクに対する応答が並列に予測されます。生成されるコードでは、parfor (MATLAB Coder) を使用して、サポートされる共有メモリマルチコアプラットフォームで並列実行されるループが作成されます。コンパイラで OpenMP アプリケーションインターフェイスがサポートされていない場合や OpenMP ライブラリを無効にした場合は、生成されるコードで予測子データが分割されず、したがって観測値が一度に 1 つずつ処理されます。サポートされるコンパイラについては、サポートされるコンパイラを参照してください。OpenMP ライブラリを無効にするには、構成オブジェクトの EnableOpenMP プロパティを false に設定します。詳細については、coder.CodeConfig (MATLAB Coder) を参照してください。

次の表は、predict の引数に関する注意です。この表に含まれていない引数は、完全にサポートされています。

引数注意と制限

引数	注意と制限
`Mdl`	モデルオブジェクトの使用上の注意および制限については、`ClassificationKernel` オブジェクトのコード生成を参照してください。
`X`	一般的なコード生成の場合、`X` は、単精度または倍精度の行列か、数値変数、カテゴリカル変数、またはその両方を含む table でなければなりません。 `X` の行数、または観測値の数は可変サイズにすることができますが、`X` の列数は固定でなければなりません。 `X` を table として指定する場合、モデルは table を使用して学習させたものでなければならず、かつ予測のためのエントリポイント関数で次を行う必要があります。データを配列として受け入れる。データ入力の引数から table を作成し、その table 内で変数名を指定する。 table を `predict` に渡す。この table のワークフローの例については、table のデータを分類するためのコードの生成を参照してください。コード生成における table の使用の詳細については、table のコード生成 (MATLAB Coder)およびコード生成における table の制限事項 (MATLAB Coder)を参照してください。

Mdl

モデルオブジェクトの使用上の注意および制限については、ClassificationKernel オブジェクトのコード生成を参照してください。

X

一般的なコード生成の場合、X は、単精度または倍精度の行列か、数値変数、カテゴリカル変数、またはその両方を含む table でなければなりません。
X の行数、または観測値の数は可変サイズにすることができますが、X の列数は固定でなければなりません。
X を table として指定する場合、モデルは table を使用して学習させたものでなければならず、かつ予測のためのエントリポイント関数で次を行う必要があります。
- データを配列として受け入れる。
- データ入力の引数から table を作成し、その table 内で変数名を指定する。
- table を predict に渡す。
この table のワークフローの例については、table のデータを分類するためのコードの生成を参照してください。コード生成における table の使用の詳細については、table のコード生成 (MATLAB Coder)およびコード生成における table の制限事項 (MATLAB Coder)を参照してください。

詳細は、統計と機械学習の関数のコード生成の紹介を参照してください。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2025a 以降)

この関数は、GPU 配列を完全にサポートします。詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2017b で導入

すべて展開する

R2025a: GPU 配列の指定 (Parallel Computing Toolbox が必要)

predict は GPU 配列を完全にサポートします。

R2023a: 予測用の C/C++ コードの生成

関数 predict に対する C/C++ コードを生成できます。

参考

ClassificationKernel | fitckernel | resume | rocmetrics | confusionchart

predict

構文

説明

例

学習セットのラベルの予測

テスト セットのラベルの予測

事後クラス確率の推定

入力引数

Mdl — バイナリ カーネル分類モデル ClassificationKernel モデル オブジェクト

X — 分類対象の予測子データ 数値行列 | table

出力引数

Label — 予測クラス ラベル categorical 配列 | 文字配列 | logical 行列 | 数値行列 | 文字ベクトルの cell 配列

Score — 分類スコア 数値配列

詳細

分類スコア

拡張機能

tall 配列 メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。 (R2023a 以降)

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2025a 以降)

バージョン履歴

R2025a: GPU 配列の指定 (Parallel Computing Toolbox が必要)

R2023a: 予測用の C/C++ コードの生成

参考

テストセットのラベルの予測

`Mdl` — バイナリカーネル分類モデル
`ClassificationKernel` モデルオブジェクト

`X` — 分類対象の予測子データ
数値行列 | table

`Label` — 予測クラスラベル
categorical 配列 | 文字配列 | logical 行列 | 数値行列 | 文字ベクトルの cell 配列

`Score` — 分類スコア
数値配列

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。 (R2023a 以降)

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2025a 以降)