X は、4177 個のアワビの貝殻について、性別 (M、F、および I (幼生))、全長、直径、高さ、全重量、むき身重量、内臓重量、貝殻重量の 8 個の属性を定義する 8 行 4177 列の行列です。このデータセットの詳細を表示するには、コマンドラインで help abalone_dataset と入力します。

既定の設定でスパース自己符号化器に学習させます。

autoenc = trainAutoencoder(X);

Figure Neural Network Training (14-Jul-2025 06:23:01) contains an object of type uigridlayout.

学習済みの自己符号化器を使用して、アワビの貝殻の輪のデータを再構成します。

XReconstructed = predict(autoenc,X);

平均二乗再構成誤差を計算します。

mseError = mse(X-XReconstructed)

mseError = 
0.0167

オプションを指定した自己符号化器の学習

ライブスクリプトを開く

サンプルデータを読み込みます。

X = abalone_dataset;

隠れサイズ 4、最大エポック数 400、および復号化器用の線形伝達関数を使用して、スパース自己符号化器に学習させます。

autoenc = trainAutoencoder(X,4,'MaxEpochs',400,...
'DecoderTransferFunction','purelin');

Figure Neural Network Training (14-Jul-2025 06:18:20) contains an object of type uigridlayout.

学習済みの自己符号化器を使用して、アワビの貝殻の輪のデータを再構成します。

XReconstructed = predict(autoenc,X);

平均二乗再構成誤差を計算します。

mseError = mse(X-XReconstructed)

mseError = 
0.0046

スパース自己符号化器を使用した観測値の再構成

ライブスクリプトを開く

学習データを生成します。

rng(0,'twister'); % For reproducibility
n = 1000;
r = linspace(-10,10,n)';
x = 1 + r*5e-2 + sin(r)./r + 0.2*randn(n,1);

学習データを使用して自己符号化器に学習させます。

hiddenSize = 25;
autoenc = trainAutoencoder(x',hiddenSize,...
        'EncoderTransferFunction','satlin',...
        'DecoderTransferFunction','purelin',...
        'L2WeightRegularization',0.01,...
        'SparsityRegularization',4,...
        'SparsityProportion',0.10);

Figure Neural Network Training (14-Jul-2025 06:08:31) contains an object of type uigridlayout.

テストデータを生成します。

n = 1000;
r = sort(-10 + 20*rand(n,1));
xtest = 1 + r*5e-2 + sin(r)./r + 0.4*randn(n,1);

学習済みの自己符号化器 autoenc を使用してテストデータを予測します。

xReconstructed = predict(autoenc,xtest');

実際のテストデータと予測をプロットします。

figure;
plot(xtest,'r.');
hold on
plot(xReconstructed,'go');

Figure contains an axes object. The axes object contains 2 objects of type line. One or more of the lines displays its values using only markers

スパース自己符号化器を使用した手書きの数字イメージの再構成

スクリプトを開く

学習データを読み込みます。

XTrain = digitTrainCellArrayData;

学習データは 1 行 5000 列の cell 配列です。各セルには、手書きの数字の合成イメージを表す 28 行 28 列の行列が含まれます。

25 個のニューロンが含まれる隠れ層を使用して自己符号化器に学習させます。

hiddenSize = 25;
autoenc = trainAutoencoder(XTrain,hiddenSize,...
        'L2WeightRegularization',0.004,...
        'SparsityRegularization',4,...
        'SparsityProportion',0.15);

テストデータを読み込みます。

XTest = digitTestCellArrayData;

テストデータは 1 行 5000 列の cell 配列です。各セルには、手書きの数字の合成イメージを表す 28 行 28 列の行列が含まれます。

学習済みの自己符号化器 autoenc を使用してテストイメージデータを再構成します。

xReconstructed = predict(autoenc,XTest);

実際のテストデータを表示します。

figure;
for i = 1:20
    subplot(4,5,i);
    imshow(XTest{i});
end

再構成されたテストデータを表示します。

figure;
for i = 1:20
    subplot(4,5,i);
    imshow(xReconstructed{i});
end

入力引数

すべて折りたたむ

`X` — 学習データ
行列 | イメージデータの cell 配列

学習データ。学習サンプルの行列またはイメージデータの cell 配列として指定します。X が行列の場合、各列に 1 つのサンプルが含まれます。X がイメージデータの cell 配列の場合、各セルのデータの次元の数が同じでなければなりません。イメージデータは、グレーイメージのピクセル強度データにすることができます。この場合、各セルには m 行 n 列の行列が格納されます。または、イメージデータを RGB データにすることができます。この場合、各セルには m 行 n-3 列の行列が格納されます。

データ型: single | double | cell

`hiddenSize` — 自己符号化器の隠れ表現のサイズ
10 (既定値) | 正の整数値

自己符号化器の隠れ表現のサイズ。正の整数値として指定します。この数値は、隠れ層のニューロンの数になります。

データ型: single | double

名前と値の引数

すべて折りたたむ

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで、Name は引数名で、Value は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。

R2021a より前では、コンマを使用して名前と値をそれぞれ区切り、Name を引用符で囲みます。

例: 'EncoderTransferFunction','satlin','L2WeightRegularization',0.05 は、符号化器の伝達関数に正の飽和線形伝達関数、L2 重み正則化に 0.05 を指定します。

`EncoderTransferFunction` — 符号化器の伝達関数
`'logsig'` (既定値) | `'satlin'`

符号化器の伝達関数。'EncoderTransferFunction' と、次のいずれかで構成されるコンマ区切りのペアとして指定します。

伝達関数オプション定義

伝達関数オプション	定義
`'logsig'`	ロジスティックシグモイド関数 $f (z) = \frac{1}{1 + e^{- z}}$
`'satlin'`	正の飽和線形伝達関数 $f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

'logsig'

ロジスティックシグモイド関数

$f (z) = \frac{1}{1 + e^{- z}}$

'satlin'

正の飽和線形伝達関数

$f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

例: 'EncoderTransferFunction','satlin'

`DecoderTransferFunction` — 復号化器の伝達関数
`'logsig'` (既定値) | `'satlin'` | `'purelin'`

復号化器の伝達関数。'DecoderTransferFunction' と、次のいずれかで構成されるコンマ区切りのペアとして指定します。

伝達関数オプション定義

伝達関数オプション	定義
`'logsig'`	ロジスティックシグモイド関数 $f (z) = \frac{1}{1 + e^{- z}}$
`'satlin'`	正の飽和線形伝達関数 $f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$
`'purelin'`	線形伝達関数 $f (z) = z$

'logsig'

ロジスティックシグモイド関数

$f (z) = \frac{1}{1 + e^{- z}}$

'satlin'

正の飽和線形伝達関数

$f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

'purelin'

線形伝達関数

$f (z) = z$

例: 'DecoderTransferFunction','purelin'

`MaxEpochs` — 最大学習エポック数
1000 (既定値) | 正の整数値

学習エポックまたは反復の最大回数。'MaxEpochs' と正の整数値で構成されるコンマ区切りのペアとして指定します。

例: 'MaxEpochs',1200

`L2WeightRegularization` — L₂ 重み正則化項の係数
0.001 (既定値) | 正のスカラー値

コスト関数の L₂ 重み正則化項の係数 (LossFunction)。'L2WeightRegularization' と正のスカラー値で構成されるコンマ区切りのペアとして指定します。

例: 'L2WeightRegularization',0.05

`LossFunction` — 学習に使用する損失関数
`'msesparse'` (既定値)

学習に使用する損失関数。'LossFunction' と 'msesparse' で構成されるコンマ区切りのペアとして指定します。これは、以下のようにスパース自己符号化器の学習用に調整された平均二乗誤差関数に対応しています。

$E = \underset{mean squared error}{\underset{︸}{\frac{1}{N} \sum_{n = 1}^{N} \sum_{k = 1}^{K} {(x_{k n} - {\hat{x}}_{k n})}^{2}}} + λ * \underset{\begin{matrix} L_{2} \\ regularization \end{matrix}}{\underset{︸}{Ω_{w e i g h t s}}} + β * \underset{\begin{matrix} sparsity \\ regularization \end{matrix}}{\underset{︸}{Ω_{s p a r s i t y}}},$

ここで、λ は L₂ 正則化項の係数、β はスパース正則化項の係数です。自己符号化器の学習時に、名前と値のペアの引数 L2WeightRegularization および SparsityRegularization を使用して、λ および β の値をそれぞれ指定できます。

`ShowProgressWindow` — 学習ウィンドウを表示するかどうかのインジケーター
`true` (既定値) | `false`

学習ウィンドウを表示するかどうかのインジケーター。'ShowProgressWindow' と、true または false のいずれかで構成されるコンマ区切りのペアとして指定します。

例: 'ShowProgressWindow',false

`SparsityProportion` — ニューロンが応答する学習例の目標比率
0.05 (既定値) | 0 から 1 の範囲にある正のスカラー値

ニューロンが応答する学習例の目標比率。'SparsityProportion' と正のスカラー値で構成されるコンマ区切りのペアとして指定します。スパース率は、スパース正則化項のパラメーターです。これは、隠れ層からの出力のスパース性を制御します。SparsityProportion に低い値を指定すると、通常、隠れ層の各ニューロンは、少数の学習例の出力を大きくした場合に限り "特殊化" します。したがって、スパース率を低くすると、スパース度が高くなります。スパース自己符号化器を参照してください。

例: 'SparsityProportion',0.01 は、隠れ層の各ニューロンの学習例に対する平均出力が 0.1 になるようにすることと等価です。

`SparsityRegularization` — スパース正則化項の影響を制御する係数
1 (既定値) | 正のスカラー値

コスト関数のスパース正則化項の影響を制御する係数。'SparsityRegularization' と正のスカラー値で構成されるコンマ区切りのペアとして指定します。

例: 'SparsityRegularization',1.6

`TrainingAlgorithm` — 自己符号化器の学習に使用するアルゴリズム
`'trainscg'` (既定値)

自己符号化器の学習に使用するアルゴリズム。'TrainingAlgorithm' と 'trainscg' で構成されるコンマ区切りのペアとして指定します。これは、スケーリング共役勾配降下法 [1] を意味します。

`ScaleData` — 入力データを再スケーリングするかどうかのインジケーター
`true` (既定値) | `false`

入力データを再スケーリングするかどうかのインジケーター。'ScaleData' と、true または false のいずれかで構成されるコンマ区切りのペアとして指定します。

自己符号化器は、出力で入力を複製しようとします。これを可能にするには、入力データの範囲が復号化器の伝達関数の範囲と一致しなければなりません。trainAutoencoder は、自己符号化器の学習時に、この範囲に合わせて学習データを自動的にスケーリングします。自己符号化器の学習時にデータがスケーリングされた場合、predict、encode、および decode の各メソッドでもデータのスケーリングが行われます。

例: 'ScaleData',false

`UseGPU` — 学習に GPU を使用するかどうかのインジケーター
`false` (既定値) | `true`

学習に GPU を使用するかどうかのインジケーター。'UseGPU' と、true または false のいずれかで構成されるコンマ区切りのペアとして指定します。

例: 'UseGPU',true

出力引数

すべて折りたたむ

`autoenc` — 学習済みの自己符号化器
`Autoencoder` オブジェクト

学習済みの自己符号化器。Autoencoder オブジェクトとして返されます。このオブジェクトのプロパティとメソッドについては、Autoencoder クラスのページを参照してください。

詳細

すべて折りたたむ

自己符号化器

自己符号化器とは、出力で入力を複製するように学習させられたニューラルネットワークです。ラベル付けされたデータを必要としないという意味で、自己符号化器が行う学習は教師なし学習です。ただし、学習プロセスはコスト関数の最適化をベースにしています。コスト関数は、入力 x と、その出力での再構成 $\hat{x}$ の誤差を測定します。

自己符号化器は、符号化器と復号化器で構成されています。符号化器と復号化器には複数の層がある場合がありますが、単純化のために、それぞれの層が 1 つだけであると考えます。

自己符号化器への入力がベクトル $x \in ℝ^{D_{x}}$ である場合、符号化器は以下のようにベクトル x を別のベクトル $z \in ℝ^{D^{(1)}}$ にマッピングします。

$z = h^{^{(1)}} (W^{(1)} x + b^{(1)}),$

ここで、上付き文字 (1) は最初の層を示します。 $h^{(1)} : ℝ^{D^{(1)}} \to ℝ^{D^{(1)}}$ は符号化器の伝達関数、 $W^{(1)} \in ℝ^{D^{(1)} \times D_{^{x}}}$ は重み行列、 $b^{(1)} \in ℝ^{D^{(1)}}$ はバイアスベクトルです。次に、復号化器が、符号化された表現 z を以下のように元の入力ベクトル x の推定に逆マッピングします。

$\hat{x} = h^{^{(2)}} (W^{(2)} z + b^{(2)}),$

ここで、上付き文字 (2) は 2 番目の層を表します。 $h^{(2)} : ℝ^{D_{x}} \to ℝ^{D_{x}}$ は復号化器の伝達関数、 $W^{(1)} \in ℝ^{D_{^{x}} \times D^{(1)}}$ は重み行列、 $b^{(2)} \in ℝ^{D_{x}}$ はバイアスベクトルです。

スパース自己符号化器

正則化項をコスト関数に追加することによって、自己符号化器のスパース性を高めることができます [2]。この正則化項は、ニューロンの平均出力活性化値の関数です。ニューロン i の平均出力活性化測定値は、以下のように定義されます。

${\hat{ρ}}_{i} = \frac{1}{n} \sum_{j = 1}^{n} z_{i}^{(1)} (x_{j}) = \frac{1}{n} \sum_{j = 1}^{n} h (w_{i}^{(1) T} x_{j} + b_{i}^{(1)}),$

ここで、n は学習例の総数です。x_j は j 番目の学習例、 $w_{i}^{(1) T}$ は重み行列 $W^{(1)}$ の i 番目の行、 $b_{i}^{(1)}$ はバイアスベクトル $b^{(1)}$ の i 番目のエントリです。出力活性化値が大きい場合、ニューロンが '活性化' していると見なされます。出力活性化値が小さい場合、学習例の数が少ないことに応答して隠れ層のニューロンが活性化することを意味します。コスト関数に ${\hat{ρ}}_{i}$ の値を低く抑える項を追加すると、自己符号化器が表現を学習するようになります。隠れ層の各ニューロンは、学習例の数が少ないことに対して活性化します。つまり、各ニューロンは、学習例の小規模サブセットだけに含まれる特定の特徴に応答することによって特殊化します。

スパース正則化

スパース正則化項は、隠れ層からの出力のスパース性に制約を課そうとします。ニューロン i の平均出力活性化値 ${\hat{ρ}}_{i}$ とその目標値 $ρ$ が近くない場合に大きな値を取る正則化項を追加することによって、スパース性を高めることができます [2]。このようなスパース正則化項の 1 つとして、カルバック・ライブラーダイバージェンスが挙げられます。

$Ω_{s p a r s i t y} = \sum_{i = 1}^{D^{(1)}} K L (ρ ∥ {\hat{ρ}}_{i}) = \sum_{i = 1}^{D^{(1)}} ρ \log (\frac{ρ}{{\hat{ρ}}_{i}}) + (1 - ρ) \log (\frac{1 - ρ}{1 - {\hat{ρ}}_{i}})$

カルバック・ライブラーダイバージェンスは、2 つの分布の違いを測定する関数です。この場合、 $ρ$ および ${\hat{ρ}}_{i}$ が互いに等しい場合には値 0 を取り、互いの差が開くに従い値が大きくなります。コスト関数を最小化するとこの項が小さくなるため、 $ρ$ と ${\hat{ρ}}_{i}$ が互いに近くなります。自己符号化器の学習時に、名前と値のペアの引数 SparsityProportion を使用して、平均活性化値の目標値を定義できます。

L₂ 正則化

スパース自己符号化器の学習を行う場合、重み w^(l) の値を大きく、z⁽¹⁾ の値を小さくすることによって、スパース正則化項を小さくすることができます [2]。コスト関数に対する重みに正則化項を追加すると、これが起こらなくなります。この項は L₂ 正則化項と呼ばれ、以下のように定義されます。

$Ω_{w e i g h t s} = \frac{1}{2} \sum_{l = 1}^{L} \sum_{j = 1}^{n_{l}} \sum_{i = 1}^{k_{l}} {(w_{j i}^{(l)})}^{2},$

ここで、L は隠れ層の数、n_l は層 l の出力サイズ、k_l は層 l の入力サイズです。L₂ 正則化項は、各層の重み行列の要素の二乗和です。

コスト関数

スパース自己符号化器の学習用のコスト関数は、以下のような調整された平均二乗誤差関数です。

参照

[1] Moller, M. F. “A Scaled Conjugate Gradient Algorithm for Fast Supervised Learning”, Neural Networks, Vol. 6, 1993, pp. 525–533.

[2] Olshausen, B. A. and D. J. Field. “Sparse Coding with an Overcomplete Basis Set: A Strategy Employed by V1.” Vision Research, Vol.37, 1997, pp.3311–3325.

バージョン履歴

R2015b で導入

参考

trainSoftmaxLayer | Autoencoder | encode | stack

トピック

イメージ分類用の積層自己符号化器の学習

trainAutoencoder

構文

説明

例

スパース自己符号化器の学習

オプションを指定した自己符号化器の学習

スパース自己符号化器を使用した観測値の再構成

スパース自己符号化器を使用した手書きの数字イメージの再構成

入力引数

X — 学習データ 行列 | イメージ データの cell 配列

hiddenSize — 自己符号化器の隠れ表現のサイズ 10 (既定値) | 正の整数値

名前と値の引数

EncoderTransferFunction — 符号化器の伝達関数 'logsig' (既定値) | 'satlin'

DecoderTransferFunction — 復号化器の伝達関数 'logsig' (既定値) | 'satlin' | 'purelin'

MaxEpochs — 最大学習エポック数 1000 (既定値) | 正の整数値

L2WeightRegularization — L2 重み正則化項の係数 0.001 (既定値) | 正のスカラー値

LossFunction — 学習に使用する損失関数 'msesparse' (既定値)

ShowProgressWindow — 学習ウィンドウを表示するかどうかのインジケーター true (既定値) | false

SparsityProportion — ニューロンが応答する学習例の目標比率 0.05 (既定値) | 0 から 1 の範囲にある正のスカラー値

SparsityRegularization — スパース正則化項の影響を制御する係数 1 (既定値) | 正のスカラー値

TrainingAlgorithm — 自己符号化器の学習に使用するアルゴリズム 'trainscg' (既定値)

ScaleData — 入力データを再スケーリングするかどうかのインジケーター true (既定値) | false

UseGPU — 学習に GPU を使用するかどうかのインジケーター false (既定値) | true

出力引数

autoenc — 学習済みの自己符号化器 Autoencoder オブジェクト

詳細

自己符号化器

スパース自己符号化器

スパース正則化

L2 正則化

コスト関数

参照

バージョン履歴

参考

トピック

`X` — 学習データ
行列 | イメージデータの cell 配列

`hiddenSize` — 自己符号化器の隠れ表現のサイズ
10 (既定値) | 正の整数値

`EncoderTransferFunction` — 符号化器の伝達関数
`'logsig'` (既定値) | `'satlin'`

`DecoderTransferFunction` — 復号化器の伝達関数
`'logsig'` (既定値) | `'satlin'` | `'purelin'`

`MaxEpochs` — 最大学習エポック数
1000 (既定値) | 正の整数値

`L2WeightRegularization` — L₂ 重み正則化項の係数
0.001 (既定値) | 正のスカラー値

`LossFunction` — 学習に使用する損失関数
`'msesparse'` (既定値)

`ShowProgressWindow` — 学習ウィンドウを表示するかどうかのインジケーター
`true` (既定値) | `false`

`SparsityProportion` — ニューロンが応答する学習例の目標比率
0.05 (既定値) | 0 から 1 の範囲にある正のスカラー値

`SparsityRegularization` — スパース正則化項の影響を制御する係数
1 (既定値) | 正のスカラー値

`TrainingAlgorithm` — 自己符号化器の学習に使用するアルゴリズム
`'trainscg'` (既定値)

`ScaleData` — 入力データを再スケーリングするかどうかのインジケーター
`true` (既定値) | `false`

`UseGPU` — 学習に GPU を使用するかどうかのインジケーター
`false` (既定値) | `true`

`autoenc` — 学習済みの自己符号化器
`Autoencoder` オブジェクト

L₂ 正則化