判別分析モデルの作成

判別分析のモデルは次のとおりです。

各クラス (Y) では、多変量正規分布を使用してデータ (X) を生成します。つまり、このモデルは X に混合ガウス分布があることを前提としています (gmdistribution)。
- 線形判別分析の場合、モデルでは各クラスの共分散は同じで、平均のみ変わります。
- 2 次判別分析の場合、各クラスの平均と共分散の両方が異なります。

このモデリングを前提として、fitcdiscr は各クラスの平均と共分散パラメーターを推定します。

線形判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、その結果の実測共分散行列を取得することで、標本の共分散を計算します。
2 次判別分析の場合、各クラスの標本平均を計算します。次に、まず各クラスの観測値から標本の平均を減算し、各クラスの実測共分散行列を取得することで、標本の共分散を計算します。

fit メソッドでは、近似に関する事前確率とコストを使用しません。

重み付き観測値

fitcdiscr は、以下の方法を使用して重み付けされた分類器を構築します。M は N 行 K 列のクラスメンバーシップ行列であると仮定します。

M_nk = 1 (観測値 n がクラス k に由来する場合)
M_nk = 0 (それ以外の場合)

重み付けされていないデータのクラス平均の推定は次のとおりです。

${\hat{μ}}_{k} = \frac{\sum_{n = 1}^{N} M_{n k} x_{n}}{\sum_{n = 1}^{N} M_{n k}} .$

正の重み w_n で重み付けされたデータの場合、通常の汎化は次のとおりです。

${\hat{μ}}_{k} = \frac{\sum_{n = 1}^{N} M_{n k} w_{n} x_{n}}{\sum_{n = 1}^{N} M_{n k} w_{n}} .$

重み付けされていないデータの、プールされている共分散行列の不偏推定は次のとおりです。

$\hat{Σ} = \frac{\sum_{n = 1}^{N} \sum_{k = 1}^{K} M_{n k} (x_{n} - {\hat{μ}}_{k}) {(x_{n} - {\hat{μ}}_{k})}^{T}}{N - K} .$

2 次判別分析の場合、fitcdiscr は K = 1 を使用します。

重み付けされたデータの場合、重みの合計を 1 と仮定した場合、プールされている共分散行列の不偏推定は次のとおりです。

$\hat{Σ} = \frac{\sum_{n = 1}^{N} \sum_{k = 1}^{K} M_{n k} w_{n} (x_{n} - {\hat{μ}}_{k}) {(x_{n} - {\hat{μ}}_{k})}^{T}}{1 - \sum_{k = 1}^{K} \frac{W_{k}^{(2)}}{W_{k}}},$

ここで

$W_{k} = \sum_{n = 1}^{N} M_{n k} w_{n}$ は、クラス k の重みの合計です。
$W_{k}^{(2)} = \sum_{n = 1}^{N} M_{n k} w_{n}^{2}$ は、クラスごとの重みの 2 乗の合計です。

判別分析モデルの作成

重み付き観測値

参考

関数

オブジェクト

トピック