predict

ニューラルネットワーク分類器を使用した観測値の分類

ページ内をすべて折りたたむ

構文

label = predict(Mdl,X)

label = predict(Mdl,X,'ObservationsIn',dimension)

[label,Score] = predict(___)

説明

label = predict(Mdl,X) は、学習済みのニューラルネットワーク分類モデル Mdl を使用して、table または行列 X 内の予測子データに対する予測クラスラベルを返します。

例

label = predict(Mdl,X,'ObservationsIn',dimension) は、予測子データにおける観測値の次元を、'rows' (既定) または 'columns' のいずれかで指定します。たとえば、'ObservationsIn','columns' と指定して、予測子データの列が観測値に対応することを示します。

[label,Score] = predict(___) は、前の構文におけるいずれかの入力引数の組み合わせを使用して、ラベルが特定のクラスから派生する尤度を示す分類スコアの行列も返します。X 内の各観測値について、予測クラスラベルは、すべてのクラスの中で最大のスコアに対応します。

例

すべて折りたたむ

ニューラルネットワークを使用したテストセットの観測値の分類

ライブスクリプトを開く

ニューラルネットワーク分類器を使用してテストセットの観測値のラベルを予測します。

patients データセットを読み込みます。データセットから table を作成します。各行が 1 人の患者に対応し、各列が診断の変数に対応します。変数 Smoker を応答変数として使用し、残りの変数を予測子として使用します。

load patients
tbl = table(Diastolic,Systolic,Gender,Height,Weight,Age,Smoker);

層化ホールドアウト分割を使用して、データを学習セット tblTrain とテストセット tblTest に分割します。観測値の約 30% がテストデータセット用に予約され、残りの観測値が学習データセットに使用されます。

rng("default") % For reproducibility of the partition
c = cvpartition(tbl.Smoker,"Holdout",0.30);
trainingIndices = training(c);
testIndices = test(c);
tblTrain = tbl(trainingIndices,:);
tblTest = tbl(testIndices,:);

学習セットを使用してニューラルネットワーク分類器に学習させます。tblTrain の列 Smoker を応答変数として指定します。数値予測子を標準化するための指定を行います。

Mdl = fitcnet(tblTrain,"Smoker", ...
    "Standardize",true);

テストセットの観測値を分類します。混同行列を使用して結果を可視化します。

label = predict(Mdl,tblTest);
confusionchart(tblTest.Smoker,label)

Figure contains an object of type ConfusionMatrixChart.

ニューラルネットワークモデルでテストセットの観測値が 2 つを除いて正しく分類されています。

ニューラルネットワーク分類器に含める特徴量の選択

ライブスクリプトを開く

テストセットの分類マージン、エッジ、誤差、予測を比較することにより、特徴選択を実行します。すべての予測子を使用して学習させたモデルのテストセットメトリクスを予測子のサブセットのみを使用して学習させたモデルのテストセットメトリクスと比較します。

標本ファイル fisheriris.csv を読み込みます。これには、アヤメについてのがく片の長さ、がく片の幅、花弁の長さ、花弁の幅、種の種類などのデータが格納されています。ファイルを table に読み込みます。

fishertable = readtable('fisheriris.csv');

層化ホールドアウト分割を使用して、データを学習セット trainTbl とテストセット testTbl に分割します。観測値の約 30% がテストデータセット用に予約され、残りの観測値が学習データセットに使用されます。

rng("default")
c = cvpartition(fishertable.Species,"Holdout",0.3);
trainTbl = fishertable(training(c),:);
testTbl = fishertable(test(c),:);

学習セット内のすべての予測子を使用して 1 つのニューラルネットワーク分類器に学習させ、PetalWidth を除くすべての予測子を使用してもう 1 つの分類器に学習させます。両方のモデルについて、Species を応答変数として指定し、予測子を標準化します。

allMdl = fitcnet(trainTbl,"Species","Standardize",true);
subsetMdl = fitcnet(trainTbl,"Species ~ SepalLength + SepalWidth + PetalLength", ...
    "Standardize",true);

2 つのモデルのテストセットの分類マージンを計算します。テストセットに含まれる観測値は 45 個だけであるため、棒グラフを使用してマージンを表示します。

各観測値の分類マージンは、真のクラスの分類スコアと偽のクラスの最大スコアの差を表します。ニューラルネットワーク分類器から返される分類スコアは事後確率であるため、マージンの値が 1 に近いほど信頼度が高い分類であることを示し、負のマージンの値は誤分類を示します。

tiledlayout(2,1)

% Top axes
ax1 = nexttile;
allMargins = margin(allMdl,testTbl);
bar(ax1,allMargins)
xlabel(ax1,"Observation")
ylabel(ax1,"Margin")
title(ax1,"All Predictors")

% Bottom axes
ax2 = nexttile;
subsetMargins = margin(subsetMdl,testTbl);
bar(ax2,subsetMargins)
xlabel(ax2,"Observation")
ylabel(ax2,"Margin")
title(ax2,"Subset of Predictors")

Figure contains 2 axes objects. Axes object 1 with title All Predictors, xlabel Observation, ylabel Margin contains an object of type bar. Axes object 2 with title Subset of Predictors, xlabel Observation, ylabel Margin contains an object of type bar.

2 つのモデルのテストセットの分類エッジ (分類マージンの平均) を比較します。

allEdge = edge(allMdl,testTbl)

allEdge = 
0.8198

subsetEdge = edge(subsetMdl,testTbl)

subsetEdge = 
0.9556

テストセットの分類マージンと分類エッジからは、予測子のサブセットで学習させたモデルの方がすべての予測子で学習させたモデルよりも性能が優れていると考えられます。

2 つのモデルのテストセットの分類誤差を比較します。

allError = loss(allMdl,testTbl);
allAccuracy = 1-allError

allAccuracy = 
0.9111

subsetError = loss(subsetMdl,testTbl);
subsetAccuracy = 1-subsetError

subsetAccuracy = 
0.9778

この場合も、予測子のサブセットのみを使用して学習させたモデルの方がすべての予測子を使用して学習させたモデルよりも性能が優れていることがわかります。

混同行列を使用してテストセットの分類結果を可視化します。

allLabels = predict(allMdl,testTbl);
figure
confusionchart(testTbl.Species,allLabels)
title("All Predictors")

Figure contains an object of type ConfusionMatrixChart. The chart of type ConfusionMatrixChart has title All Predictors.

subsetLabels = predict(subsetMdl,testTbl);
figure
confusionchart(testTbl.Species,subsetLabels)
title("Subset of Predictors")

Figure contains an object of type ConfusionMatrixChart. The chart of type ConfusionMatrixChart has title Subset of Predictors.

すべての予測子を使用して学習させたモデルには、テストセットの観測値の誤分類が 4 件あります。予測子のサブセットを使用して学習させたモデルでは、テストセットの観測値の誤分類は 1 件だけです。

2 つのモデルのテストセットの性能から、PetalWidth を除くすべての予測子を使用して学習させたモデルを使用することを検討します。

ニューラルネットワーク分類器の層の構造を使用した予測

ライブスクリプトを開く

単一の観測値のラベルと分類スコアを予測するためにニューラルネットワーク分類器の層がどのように連携するかを調べます。

fishertable = readtable('fisheriris.csv');

データセットを使用してニューラルネットワーク分類器に学習させます。fishertable の列 Species を応答変数として指定します。

Mdl = fitcnet(fishertable,"Species");

データセットから 15 番目の観測値を選択します。ニューラルネットワーク分類器の層が観測値をどのように扱い、予測クラスラベル newPointLabel と分類スコア newPointScores をどのように返すかを調べます。

newPoint = Mdl.X{15,:}

newPoint = 1×4

    5.8000    4.0000    1.2000    0.2000

firstFCStep = (Mdl.LayerWeights{1})*newPoint' + Mdl.LayerBiases{1};
reluStep = max(firstFCStep,0);

finalFCStep = (Mdl.LayerWeights{end})*reluStep + Mdl.LayerBiases{end};
finalSoftmaxStep = softmax(finalFCStep);

[~,classIdx] = max(finalSoftmaxStep);
newPointLabel = Mdl.ClassNames{classIdx}

newPointLabel = 
'setosa'

newPointScores = finalSoftmaxStep'

newPointScores = 1×3

    1.0000    0.0000    0.0000

オブジェクト関数 predict で返される予測と一致することを確認します。

[predictedLabel,predictedScores] = predict(Mdl,newPoint)

predictedLabel = 1×1 cell array
    {'setosa'}

predictedScores = 1×3

    1.0000    0.0000    0.0000

入力引数

すべて折りたたむ

`Mdl` — 学習させたニューラルネットワーク分類器
`ClassificationNeuralNetwork` モデルオブジェクト | `CompactClassificationNeuralNetwork` モデルオブジェクト

学習させたニューラルネットワーク分類器。fitcnet によって返される ClassificationNeuralNetwork モデルオブジェクト、または compact によって返される CompactClassificationNeuralNetwork モデルオブジェクトとして指定します。

`X` — 分類対象の予測子データ
数値行列 | table

分類対象の予測子データ。数値行列または table を指定します。

既定では、X の各行は 1 つの観測値に対応し、各列は 1 つの変数に対応します。

数値行列の場合
- X の列に含まれている変数の順序は、Mdl に学習させた予測子変数の順序と同じでなければなりません。
- table (たとえば Tbl) を使用して Mdl に学習をさせる場合、Tbl に含まれている予測子変数が数値のみであれば、X を数値行列にすることができます。学習時に Tbl 内の数値予測子をカテゴリカルとして扱うには、fitcnet の名前と値の引数 CategoricalPredictors を使用してカテゴリカル予測子を指定します。Tbl に種類の異なる予測子変数 (数値および categorical データ型など) が混在し、X が数値行列である場合、predict でエラーがスローされます。
table の場合
- predict は、文字ベクトルの cell 配列ではない cell 配列や複数列の変数をサポートしません。
- table (たとえば Tbl) を使用して Mdl に学習をさせた場合、X 内のすべての予測子変数は変数名およびデータ型が、Mdl に学習させた (Mdl.PredictorNames に格納されている) 変数と同じでなければなりません。ただし、X の列の順序が Tbl の列の順序に対応する必要はありません。また、Tbl と X に追加の変数 (応答変数や観測値の重みなど) を含めることができますが、predict はこれらを無視します。
- 数値行列を使用して Mdl に学習をさせる場合、Mdl.PredictorNames 内の予測子名と X 内の対応する予測子変数名が同じでなければなりません。学習時に予測子の名前を指定するには、fitcnet の名前と値の引数 PredictorNames を使用します。X 内の予測子変数はすべて数値ベクトルでなければなりません。X に追加の変数 (応答変数や観測値の重みなど) を含めることができますが、predict はこれらを無視します。

Mdl に学習させるときに fitcnet で 'Standardize',true を設定した場合、予測子データの数値列が対応する平均および標準偏差を使用して標準化されます。

メモ

観測値が列に対応するように予測子行列を配置して 'ObservationsIn','columns' を指定すると、計算時間が大幅に短縮される可能性があります。table の予測子データに対して 'ObservationsIn','columns' を指定することはできません。

データ型: single | double | table

`dimension` — 予測子データにおける観測値の次元
`'rows'` (既定値) | `'columns'`

予測子データにおける観測値の次元。'rows' または 'columns' として指定します。

メモ

データ型: char | string

出力引数

すべて折りたたむ

`label` — 予測クラスラベル
数値ベクトル | categorical ベクトル | logical ベクトル | 文字配列 | string 配列 | 文字ベクトルの cell 配列

予測クラスラベル。数値ベクトル、categorical ベクトル、logical ベクトル、文字配列、string 配列、または文字ベクトルの cell 配列として返されます。観測値の分類は、分類スコアまたは事後確率が最大になるクラスに観測値を割り当てることで予測されます。

label は、Mdl に学習させた観測済みクラスラベルと同じデータ型になり、X の観測値の数と同じ長さになります。(string 配列は文字ベクトルの cell 配列として扱われます)。

`Score` — 分類スコア
数値行列

分類スコア。n 行 K 列の行列として返されます。n は X 内の観測値の数、K は一意のクラスの数です。分類スコア Score(i,j) は、i 番目の観測値がクラス j に属する事後確率を表します。

詳細

すべて折りたたむ

分類スコア

ニューラルネットワーク分類器の "分類スコア" は、ネットワークの最終全結合層に続くソフトマックス活性化関数を使用して計算されます。スコアは事後確率に対応します。

観測値 x がクラス k に属する事後確率は次のとおりです。

$\hat{P} (k | x) = \frac{P (x | k) P (k)}{\sum_{j = 1}^{K} P (x | j) P (j)} = \frac{\exp (a_{k} (x))}{\sum_{j = 1}^{K} \exp (a_{j} (x))}$

ここで

P(x|k) は、x がクラス k に属する条件付き確率です。
P(k) は、クラス k の事前確率です。
K は、応答変数内のクラスの数です。
a_k(x) は、観測値 x に対する最終全結合層からの k の出力です。

代替機能

Simulink ブロック

Simulink^® にニューラルネットワーク分類モデルの予測を統合するには、Statistics and Machine Learning Toolbox™ ライブラリにある ClassificationNeuralNetwork Predict ブロックを使用するか、MATLAB^® Function ブロックを関数 predict と共に使用します。例については、ClassificationNeuralNetwork Predict ブロックの使用によるクラスラベルの予測とMATLAB Function ブロックの使用によるクラスラベルの予測を参照してください。

使用するアプローチを判断する際は、以下を考慮してください。

Statistics and Machine Learning Toolbox ライブラリブロックを使用する場合、固定小数点ツール (Fixed-Point Designer)を使用して浮動小数点モデルを固定小数点に変換できます。
MATLAB Function ブロックを関数 predict と共に使用する場合は、可変サイズの配列に対するサポートを有効にしなければなりません。
MATLAB Function ブロックを使用する場合、予測の前処理や後処理のために、同じ MATLAB Function ブロック内で MATLAB 関数を使用することができます。

拡張機能

すべて展開する

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

使用上の注意および制限:

saveLearnerForCoder、loadLearnerForCoder および codegen (MATLAB Coder) を使用して、関数 predict のコードを生成します。saveLearnerForCoder を使用して、学習済みモデルを保存します。loadLearnerForCoder を使用して保存済みモデルを読み込んで関数 predict を呼び出す、エントリポイント関数を定義します。次に、codegen を使用して、エントリポイント関数のコードを生成します。
predict の単精度の C/C++ コードを生成するには、loadLearnerForCoder 関数を呼び出すときに DataType="single" を指定します。

次の表は、predict の引数に関する注意です。この表に含まれていない引数は、完全にサポートされています。

引数	注意と制限
`Mdl`	モデルオブジェクトの使用上の注意および制限については、`CompactClassificationNeuralNetwork` オブジェクトのコード生成を参照してください。
`X`	`X` は、単精度または倍精度の行列か、数値変数、カテゴリカル変数、またはその両方を含む table でなければなりません。 `X` の行数、または観測値の数は可変サイズにすることができますが、`X` の列数は固定でなければなりません。 `X` を table として指定する場合、モデルは table を使用して学習させたものでなければならず、かつ予測のためのエントリポイント関数で次を行う必要があります。データを配列として受け入れる。データ入力の引数から table を作成し、その table 内で変数名を指定する。 table を `predict` に渡す。この table のワークフローの例については、table のデータを分類するためのコードの生成を参照してください。コード生成における table の使用の詳細については、table のコード生成 (MATLAB Coder)およびコード生成における table の制限事項 (MATLAB Coder)を参照してください。
`ObservationsIn`	名前と値の引数 `ObservationsIn` の `dimension` の値は、コンパイル時の定数でなければなりません。たとえば、生成されたコードで `"ObservationsIn","columns"` を使用するには、`{coder.Constant("ObservationsIn"),coder.Constant("columns")}` を `codegen` (MATLAB Coder) の `-args` の値に含めます。

詳細は、統計と機械学習の関数のコード生成の紹介を参照してください。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2024b 以降)

この関数は、GPU 配列を完全にサポートします。詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2021a で導入

すべて展開する

R2024b: GPU 配列の指定 (Parallel Computing Toolbox が必要)

predict は GPU 配列を完全にサポートします。

参考

トピック

ニューラルネットワーク分類器の性能評価

predict

構文

説明

例

ニューラル ネットワークを使用したテスト セットの観測値の分類

ニューラル ネットワーク分類器に含める特徴量の選択

ニューラル ネットワーク分類器の層の構造を使用した予測

入力引数

Mdl — 学習させたニューラル ネットワーク分類器 ClassificationNeuralNetwork モデル オブジェクト | CompactClassificationNeuralNetwork モデル オブジェクト

X — 分類対象の予測子データ 数値行列 | table

dimension — 予測子データにおける観測値の次元 'rows' (既定値) | 'columns'

出力引数

label — 予測クラス ラベル 数値ベクトル | categorical ベクトル | logical ベクトル | 文字配列 | string 配列 | 文字ベクトルの cell 配列

Score — 分類スコア 数値行列

詳細

分類スコア

代替機能

Simulink ブロック

拡張機能

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2024b 以降)

バージョン履歴

R2024b: GPU 配列の指定 (Parallel Computing Toolbox が必要)

参考

トピック

ニューラルネットワークを使用したテストセットの観測値の分類

ニューラルネットワーク分類器に含める特徴量の選択

ニューラルネットワーク分類器の層の構造を使用した予測

`Mdl` — 学習させたニューラルネットワーク分類器
`ClassificationNeuralNetwork` モデルオブジェクト | `CompactClassificationNeuralNetwork` モデルオブジェクト

`X` — 分類対象の予測子データ
数値行列 | table

`dimension` — 予測子データにおける観測値の次元
`'rows'` (既定値) | `'columns'`

`label` — 予測クラスラベル
数値ベクトル | categorical ベクトル | logical ベクトル | 文字配列 | string 配列 | 文字ベクトルの cell 配列

`Score` — 分類スコア
数値行列

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。 (R2024b 以降)