ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

混合ガウス モデル

混合ガウス モデル (GMM) は、k 個の多変量正規密度成分から構成されます。ここで、k は正の整数です。各成分には、d 次元の平均 (d は正の整数)、d 行 d 列の共分散行列および混合比があります。混合比 j は、成分 j から構成される母集団の比率を決定します (j = 1,...,k)。

Statistics and Machine Learning Toolbox™ の関数 fitgmdist を使用し、k を指定して、n 行 d 列のデータ行列 X を渡すと、GMM を近似させることができます。X の列は予測子、特徴量または属性に、行は観測値または例に対応します。既定では、fitgmdist は成分ごとに異なる (または共有されない) フルの共分散行列を近似させます。

fitgmdist では、反復的な "期待値最大化" (EM) アルゴリズムを使用して GMM をデータにあてはめます。EM アルゴリズムでは、成分の平均、共分散行列および混合比の初期値を使用し、次のステップに従って処理を進めます。

  1. 各観測値について、成分メンバーシップの事後確率を計算します。この結果は、観測値 i が成分 j から派生する事後確率が要素 (i,j) に格納されている n 行 k 列の行列と考えることができます。これは、EM アルゴリズムの "E" のステップです。

  2. 成分メンバーシップの事後確率を重みとして使用し、最大尤度を適用することにより成分の平均、共分散行列および混合比を推定します。これは、EM アルゴリズムの "M" のステップです。

これらのステップは、収束するまで繰り返されます。尤度面は複雑なので、局所的な最適解に収束する場合があります。また、結果の局所的な最適解は初期条件によって異なる場合があります。fitgmdist には、k 平均++ アルゴリズムや観測値についての無作為な成分割り当てなど、初期条件を選択するためのオプションがいくつかあります。

fitgmdist は、近似させた gmdistribution モデル オブジェクトを返します。このオブジェクトには、推定結果を格納するプロパティが含まれています。これには、推定したパラメーター、収束情報および情報量基準 (赤池およびベイズ情報量基準) が含まれます。プロパティにアクセスするには、ドット表記を使用します。

GMM を近似させたら、近似結果を使用してクエリ データをクラスタリングできます。GMM を使用するクラスタリングは、ソフトなクラスタリング方式と見なされることがあります。各点の事後確率は、各データ点が各クラスターに属する確率がある程度はあることを示します。GMM を使用するクラスタリングについての詳細は、混合ガウス モデルによるクラスタリングを参照してください。

参考

| |

関連する例

詳細

この情報は役に立ちましたか?