discardSupportVectors

線形サポートベクターマシン (SVM) 分類器のサポートベクターを破棄

構文

Mdl = discardSupportVectors(MdlSV)

説明

Mdl = discardSupportVectors(MdlSV) は、学習済みの線形サポートベクターマシン (SVM) モデル Mdl を返します。Mdl と学習済みの線形 SVM モデル MdlSV はどちらも、同じタイプのオブジェクトです。つまり、これらはどちらも ClassificationSVM オブジェクトまたは CompactClassificationSVM オブジェクトのいずれかです。ただし、Mdl と MdlSV は以下の点が異なります。

Mdl では、Alpha、SupportVectors および SupportVectorLabels プロパティが空 ([]) になります。
Mdl を表示すると、Alpha プロパティではなく Beta プロパティが表示されます。

例

すべて折りたたむ

サポートベクターの破棄

ライブスクリプトを開く

サポートベクターおよび他の関連パラメーターを破棄することにより、メモリ効率を高くした線形 SVM モデルを作成します。

ionosphere データセットを読み込みます。

load ionosphere

データセット全体を使用して線形 SVM モデルを学習させます。

MdlSV = fitcsvm(X,Y)

MdlSV = 
  ClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
                    Alpha: [103×1 double]
                     Bias: -3.8827
         KernelParameters: [1×1 struct]
           BoxConstraints: [351×1 double]
          ConvergenceInfo: [1×1 struct]
          IsSupportVector: [351×1 logical]
                   Solver: 'SMO'


  Properties, Methods

MdlSV 内のサポートベクターの個数を表示します。

numSV = size(MdlSV.SupportVectors,1)

numSV = 
103

X 内の予測子変数の個数を表示します。

p = size(X,2)

p = 
34

既定では、fitcsvm は 2 クラス学習用に線形 SVM モデルを学習させます。表示には Alpha が使用されます。このモデルには 103 個のサポートベクターと 34 個の予測子が含まれています。サポートベクターを破棄すると、結果のモデルではメモリ消費量が少なくなります。

サポートベクターおよび他の関連パラメーターを破棄します。

Mdl = discardSupportVectors(MdlSV)

Mdl = 
  ClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
                     Beta: [34×1 double]
                     Bias: -3.8827
         KernelParameters: [1×1 struct]
           BoxConstraints: [351×1 double]
          ConvergenceInfo: [1×1 struct]
          IsSupportVector: [351×1 logical]
                   Solver: 'SMO'


  Properties, Methods

Mdl 内の係数を表示します。

Mdl.Alpha

ans =

     []

Mdl 内のサポートベクターを表示します。

Mdl.SupportVectors

ans =

     []

Mdl 内のサポートベクターのクラスラベルを表示します。

Mdl.SupportVectorLabels

ans =

     []

表示には Alpha ではなく Beta が使用されます。Alpha、SupportVectors および SupportVectorLabels プロパティは空になります。

モデルのサイズを比較します。

vars = whos('MdlSV','Mdl');
100*(1 - vars(1).bytes/vars(2).bytes)

ans = 
20.7370

Mdl は MdlSV より約 20% 小さくなっています。

MdlSV をワークスペースから削除します。

clear MdlSV

SVM モデルのメモリ消費量の削減

ライブスクリプトを開く

格納されているサポートベクターおよび他の関連推定値を破棄することにより、SVM モデルを圧縮します。圧縮した SVM モデルを使用して、学習データの行についてラベルを予測します。

ionosphere データセットを読み込みます。

load ionosphere
rng(1); % For reproducibility

既定のオプションを使用して SVM モデルに学習をさせます。

MdlSV = fitcsvm(X,Y);

MdlSV は、Alpha、SupportVectors および SupportVectorLabels プロパティ値が空でない ClassificationSVM モデルです。

学習データ、サポートベクターおよび関連推定値を破棄することにより、SVM モデルのサイズを小さくします。

CMdlSV = compact(MdlSV);               % Discard training data
CMdl = discardSupportVectors(CMdlSV);  % Discard support vectors

CMdl は CompactClassificationSVM モデルです。

SVM モデル MdlSV および CMdl のサイズを比較します。

vars = whos('MdlSV','CMdl');
100*(1 - vars(1).bytes/vars(2).bytes)

ans = 
97.1373

圧縮したモデル CMdl では、完全なモデルよりメモリ消費量が大幅に少なくなっています。

CMdl を使用して、学習データのランダムな行についてラベルを予測します。関数 predict は、圧縮された SVM モデルを受け入れます。また、線形 SVM モデルの場合は、新しい観測値に対するラベルの予測に Alpha、SupportVectors および SupportVectorLabels プロパティを必要としません。

idx = randsample(size(X,1),1)

idx = 
147

predictedLabel = predict(CMdl,X(idx,:))

predictedLabel = 1×1 cell array
    {'b'}

trueLabel = Y(idx)

trueLabel = 1×1 cell array
    {'b'}

入力引数

すべて折りたたむ

`MdlSV` — 学習済みの線形 SVM モデル
`ClassificationSVM` モデル | `CompactClassificationSVM` モデル

学習済みの線形 SVM モデル。ClassificationSVM または CompactClassificationSVM モデルとして指定されます。

MdlSV.KernelParameters.Function フィールドが 'linear' ではない場合 (つまり、MdlSV が線形 SVM モデルではない場合)、エラーが返されます。

ヒント

学習済みの線形 SVM モデルの場合、SupportVectors プロパティは n_sv 行 p 列の行列です。n_sv はサポートベクターの個数 (最大で学習標本のサイズ)、p は予測子または特徴量の個数です。Alpha および SupportVectorLabels プロパティは、n_sv 個の要素があるベクトルです。多くの観測値または事例が含まれている複雑なデータセットの場合、これらのプロパティが大きくなる可能性があります。Beta プロパティは、p 個の要素が含まれているベクトルです。
学習済みの SVM モデルに多数のサポートベクターが含まれている場合は、discardSupportVectors を使用して、学習済みの線形 SVM モデルが消費する領域を減らします。サポートベクター行列のサイズを表示するには、「size(MdlSV.SupportVectors)」と入力します。

アルゴリズム

predict と resubPredict は、次の式を使用して、SVM スコア f(x) の推定と、以後のラベル付けおよび事後確率の推定を行います。

$f (x) = x' β + b .$

β は Mdl.Beta、b は Mdl.Bias です。つまり、それぞれ Mdl の Beta および Bias プロパティです。詳細は、バイナリ分類のサポートベクターマシンを参照してください。

拡張機能

すべて展開する

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

この関数は、GPU 配列を完全にサポートします。詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2015a で導入

参考