Main Content

trainbr

ベイズ正則化逆伝播

説明

net.trainFcn = 'trainbr' は、ネットワークの trainFcn プロパティを設定します。

[trainedNet,tr] = train(net,...) は、trainbr を使用してネットワークに学習をさせます。

trainbr は、レーベンバーグ・マルカート法の最適化に従って重みとバイアスの値を更新するネットワーク学習関数です。誤差と重みの二乗の結合を最小化して、正しい結合を判定し、適切に汎化を行うネットワークを生成します。このプロセスは、ベイズ正則化と呼ばれます。

学習は trainbr の学習パラメーターに従って行われます。以下に、学習パラメーターをその既定値と共に示します。

  • net.trainParam.epochs — 学習の最大エポック数。既定値は 1000 です。

  • net.trainParam.goal — 性能目標。既定値は 0 です。

  • net.trainParam.mu — マルカート調整パラメーター。既定値は 0.005 です。

  • net.trainParam.mu_decmu の減少係数。既定値は 0.1 です。

  • net.trainParam.mu_incmu の増加係数。既定値は 10 です。

  • net.trainParam.mu_max — mu の最大値。既定値は 1e10 です。

  • net.trainParam.max_fail — 検証エラーの最大回数。既定値は inf です。

  • net.trainParam.min_grad — 性能の勾配の最小値。既定値は 1e-7 です。

  • net.trainParam.show — 表示間のエポック数 (表示なしは NaN)。既定値は 25 です。

  • net.trainParam.showCommandLine — コマンド ライン出力の生成。既定値は false です。

  • net.trainParam.showWindow — 学習 GUI の表示。既定値は true です。

  • net.trainParam.time — 最大学習時間 (秒単位)。既定値は inf です。

検証の停止は既定では無効になっている (max_fail = inf) ため、誤差と重みの最適な結合が見つかるまで学習を継続できます。ただし、max_fail を 6 または他の厳密に正の値に設定して検証を有効にしている場合、より短い学習時間で重みとバイアスの最小化を実現できることもあります。

すべて折りたたむ

この例では、入力 p およびターゲット t で構成される問題を、ネットワークを使用して解く方法を示します。これには、ノイズを含む正弦波のあてはめが必要です。

p = [-1:.05:1];
t = sin(2*pi*p)+0.1*randn(size(p));

2 個のニューロンがある隠れ層を持つフィードフォワード ネットワークが作成されます。

net = feedforwardnet(2,'trainbr');

ネットワークの学習とテストが行われます。

net = train(net,p,t);
a = net(p)

入力引数

すべて折りたたむ

入力ネットワーク。ネットワーク オブジェクトとして指定します。ネットワーク オブジェクトを作成するには、feedforwardnetnarxnet などを使用します。

出力引数

すべて折りたたむ

学習済みネットワーク。network オブジェクトとして返されます。

学習記録 (epoch および perf)。フィールドがネットワーク学習関数 (net.NET.trainFcn) によって異なる構造体として返されます。含まれるフィールドには以下のものがあります。

  • 学習、データ分割、性能の関数およびパラメーター

  • 学習セット、検証セット、およびテスト セットのデータ分割インデックス

  • 学習セット、検証セット、およびテスト セットのデータ分割マスク

  • エポックの数 (num_epochs) および最適なエポック (best_epoch)

  • 学習の状態名の一覧 (states)

  • 学習全体を通じて値を記録する各状態名のフィールド

  • 最適なネットワーク性能 (best_perfbest_vperfbest_tperf)

制限

この関数は、性能が二乗誤差の平均または和であると仮定して、ヤコビアンを計算に使用します。そのため、この関数によって学習するネットワークでは、mse または sse のいずれかの性能関数を使用しなければなりません。

詳細

すべて折りたたむ

ネットワークの利用

trainbrfeedforwardnet または cascadeforwardnet を使用する標準的なネットワークを作成できます。trainbr を使用して学習が行われるようにカスタム ネットワークを準備するには、以下のようにします。

  1. NET.trainFcn'trainbr' に設定します。これにより、NET.trainParamtrainbr の既定のパラメーターに設定されます。

  2. NET.trainParam プロパティを目的の値に設定します。

どちらの場合も、結果として得られるネットワークで train を呼び出すことによって、trainbr を使用してネットワークの学習を行います。例については、feedforwardnet および cascadeforwardnet を参照してください。

アルゴリズム

trainbr は、重み関数、正味入力関数、および伝達関数に導関数がある限り、任意のネットワークの学習を行うことができます。

ベイズ正則化は、誤差と重みの二乗の線形結合を最小化します。さらに、学習の終了時に結果として得られるネットワークの汎化品質が良好になるように、線形結合を変更します。ベイズ正則化の詳細は、MacKay (Neural Computation, Vol. 4, No. 3, 1992, pp. 415 to 447) および Foresee and Hagan (Proceedings of the International Joint Conference on Neural Networks, June, 1997) を参照してください。

このベイズ正則化は、レーベンバーグ・マルカート法アルゴリズム内で行われます。重みとバイアスの変数 X に対する性能 perf のヤコビアン jX の計算には、逆伝播が使用されます。各変数は、レーベンバーグ・マルカート法に従って調整されます。

jj = jX * jX
je = jX * E
dX = -(jj+I*mu) \ je

ここで、E はすべての誤差であり、I は単位行列です。

上記の変更によって性能値が減少するまで、適応値 mumu_inc ずつ増加します。その後、ネットワークに対して変更が行われ、mumu_dec ずつ減少します。

次のいずれかの条件が発生すると、学習が停止します。

  • epochs (反復回数) の最大数に達する。

  • time の最大値を超える。

  • 性能が goal に最小化される。

  • 性能の勾配が min_grad より小さくなる。

  • mumu_max を超える。

参照

[1] MacKay, David J. C. "Bayesian interpolation." Neural computation. Vol. 4, No. 3, 1992, pp. 415–447.

[2] Foresee, F. Dan, and Martin T. Hagan. "Gauss-Newton approximation to Bayesian learning." Proceedings of the International Joint Conference on Neural Networks, June, 1997.

バージョン履歴

R2006a より前に導入