Main Content

判別分析モデルの作成

判別分析のモデルは次のとおりです。

  • 各クラス (Y) では、多変量正規分布を使用してデータ (X) を生成します。つまり、このモデルは X に混合ガウス分布があることを前提としています (gmdistribution)。

    • 線形判別分析の場合、モデルでは各クラスの共分散は同じで、平均のみ変わります。

    • 2 次判別分析の場合、各クラスの平均と共分散の両方が異なります。

このモデリングを前提として、fitcdiscr は各クラスの平均と共分散パラメーターを推定します。

  • 線形判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、その結果の実測共分散行列を取得することで、標本の共分散を計算します。

  • 2 次判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、各クラスの実測共分散行列を取得することで、標本の共分散を計算します。

fit メソッドでは、近似に関する事前確率とコストを使用しません。

重み付き観測値

fitcdiscr は、以下の方法を使用して重み付けされた分類器を構築します。M は N 行 K 列のクラス メンバーシップ行列であると仮定します。

Mnk = 1 (観測値 n がクラス k に由来する場合)
Mnk = 0 (それ以外の場合)

重み付けされていないデータのクラス平均の推定は次のとおりです。

μ^k=n=1NMnkxnn=1NMnk.

正の重み wn で重み付けされたデータの場合、通常の汎化は次のとおりです。

μ^k=n=1NMnkwnxnn=1NMnkwn.

重み付けされていないデータの、プールされている共分散行列の不偏推定は次のとおりです。

Σ^=n=1Nk=1KMnk(xnμ^k)(xnμ^k)TNK.

2 次判別分析の場合、fitcdiscrK = 1 を使用します。

重み付けされたデータの場合、重みの合計を 1 と仮定した場合、プールされている共分散行列の不偏推定は次のとおりです。

Σ^=n=1Nk=1KMnkwn(xnμ^k)(xnμ^k)T1k=1KWk(2)Wk,

ここで

  • Wk=n=1NMnkwn は、クラス k の重みの合計です。

  • Wk(2)=n=1NMnkwn2 は、クラスごとの重みの 2 乗の合計です。

参考

関数

オブジェクト

関連するトピック