判別分析モデルの作成
判別分析のモデルは次のとおりです。
各クラス (
Y
) では、多変量正規分布を使用してデータ (X
) を生成します。つまり、このモデルはX
に混合ガウス分布があることを前提としています (gmdistribution
)。線形判別分析の場合、モデルでは各クラスの共分散は同じで、平均のみ変わります。
2 次判別分析の場合、各クラスの平均と共分散の両方が異なります。
このモデリングを前提として、fitcdiscr
は各クラスの平均と共分散パラメーターを推定します。
線形判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、その結果の実測共分散行列を取得することで、標本の共分散を計算します。
2 次判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、各クラスの実測共分散行列を取得することで、標本の共分散を計算します。
fit
メソッドでは、近似に関する事前確率とコストを使用しません。
重み付き観測値
fitcdiscr
は、以下の方法を使用して重み付けされた分類器を構築します。M は N 行 K 列のクラス メンバーシップ行列であると仮定します。
Mnk = 1 (観測値 n がクラス k に由来する場合)
Mnk = 0 (それ以外の場合)
重み付けされていないデータのクラス平均の推定は次のとおりです。
正の重み wn で重み付けされたデータの場合、通常の汎化は次のとおりです。
重み付けされていないデータの、プールされている共分散行列の不偏推定は次のとおりです。
2 次判別分析の場合、fitcdiscr
は K = 1 を使用します。
重み付けされたデータの場合、重みの合計を 1 と仮定した場合、プールされている共分散行列の不偏推定は次のとおりです。
ここで
は、クラス k の重みの合計です。
は、クラスごとの重みの 2 乗の合計です。