ドキュメンテーションヘルプ センタードキュメンテーション
このページは前リリースの情報です。該当の英語のページはこのリリースで削除されています。
単純ベイズ分類器の再代入分類エッジ
e = resubEdge(Mdl)
例
e = resubEdge(Mdl) は、Mdl.X に保存された学習データと、Mdl.Y に保存された対応するクラス ラベルを使用して、単純ベイズ分類器 Mdl の再代入分類エッジ (e) を返します。
e
Mdl
Mdl.X
Mdl.Y
分類エッジは、分類マージンの加重平均を表すスカラー値です。
すべて折りたたむ
単純ベイズ分類器の再代入エッジ (標本内の平均分類マージン) を推定します。
fisheriris データセットを読み込みます。150 本のアヤメについて 4 つの花弁の測定値が含まれる数値行列 X を作成します。対応するアヤメの種類が含まれる文字ベクトルの cell 配列 Y を作成します。
fisheriris
X
Y
load fisheriris X = meas; Y = species; rng('default') % for reproducibility
予測子 X とクラス ラベル Y を使用して、単純ベイズ分類器に学習させます。クラス名を指定することが推奨されます。fitcnb は、各予測子が条件付き正規分布に従うと仮定しています。
fitcnb
Mdl = fitcnb(X,Y,'ClassNames',{'setosa','versicolor','virginica'})
Mdl = ClassificationNaiveBayes ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 150 DistributionNames: {'normal' 'normal' 'normal' 'normal'} DistributionParameters: {3x4 cell} Properties, Methods
Mdl は学習させた ClassificationNaiveBayes 分類器です。
ClassificationNaiveBayes
再代入エッジを推定します。
e = 0.8944
学習標本マージンの平均は約 0.89 です。この結果は、分類器ラベルの標本内観測値の信頼度が高いことを示します。
0.89
分類器エッジは、分類器マージンの平均を測定します。特徴選択を行う方法のひとつとして、複数のモデルからの学習標本エッジを比較します。この条件のみに基づくと、エッジが最高となる分類器が最善の分類器となります。
ionosphere データセットを読み込みます。安定させるため、最初の 2 つの予測子を削除します。
ionosphere
load ionosphere X = X(:,3:end);
次の 2 つのデータセットを定義します。
fullX にはすべての予測子が含まれます。
fullX
partX には上位 10 個の最も重要な予測子が含まれます。
partX
fullX = X; idx = fscmrmr(X,Y); partX = X(:,idx(1:10));
各予測子セットの単純ベイズ分類器に学習させます。
FullMdl = fitcnb(fullX,Y); PartMdl = fitcnb(partX,Y);
FullMdl と PartMdl は、学習済みの ClassificationNaiveBayes 分類器です。
FullMdl
PartMdl
分類器ごとに学習標本エッジを推定します。
fullEdge = resubEdge(FullMdl)
fullEdge = 0.6554
partEdge = resubEdge(PartMdl)
partEdge = 0.7796
上位 10 個の最も重要な予測子で学習させた分類器のエッジの方が大きくなります。この結果は、これらの予測子だけを使用して学習させた分類器の標本内近似の方が優れていることを示しています。
完全な学習済み単純ベイズ分類器。fitcnb で学習させた ClassificationNaiveBayes モデルとして指定します。
"分類エッジ" は、分類マージンの加重平均です。
重みを指定すると、この重みは正規化され、各クラスの事前確率の合計になります。正規化された重みを使用して、加重平均が計算されます。
複数の分類器を選択して特徴選択などのタスクを実行する場合は、最も高いエッジが得られる分類器を選択します。
各観測値の "分類マージン" は、真のクラスのスコアと偽のクラスの最大スコアの差です。マージンは分類の信頼尺度となります。つまり、複数の分類器がある場合、(同じスケールで) より大きいマージンが得られる分類器の方が優れています。
"事後確率" はデータが与えられる場合に、観測値が特定のクラスに属している確率です。
単純ベイズの場合、与えられた観測値 (x1,...,xP) の分類が k になる事後確率は次のようになります。
P^(Y=k|x1,..,xP)=P(X1,...,XP|y=k)π(Y=k)P(X1,...,XP),
ここで
P(X1,...,XP|y=k) は、予測子がクラス k に含まれる場合の条件付き同時密度です。予測子の分布名は Mdl.DistributionNames に格納します。
Mdl.DistributionNames
π(Y = k) はクラスの事前確率の分布です。Mdl.Prior は事前分布を保存します。
Mdl.Prior
P(X1,..,XP) は予測子の同時密度です。各クラスは離散的なので、次のようになります。P(X1,...,XP)=∑k=1KP(X1,...,XP|y=k)π(Y=k).
クラスの "事前確率" は、母集団内でそのクラスの観測値が出現すると考えられる相対頻度です。
単純ベイズの "スコア" は観測が与えられる場合のクラスの事後確率です。
ClassificationNaiveBayes | CompactClassificationNaiveBayes | edge | fitcnb | loss | margin | predict | resubEdge | resubLoss | resubLoss | resubMargin
CompactClassificationNaiveBayes
edge
loss
margin
predict
resubEdge
resubLoss
resubMargin
この例の変更されたバージョンがあります。編集された方の例を開きますか?
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Contact your local office