dljacobian

ヤコビ行列深層学習演算

R2024b 以降

ページ内をすべて折りたたむ

構文

jac = dljacobian(u,x,dim)

jac = dljacobian(u,x,dim,EnableHigherDerivatives=tf)

説明

ヤコビアン深層学習演算は、指定された入力データと演算次元に関して、ニューラルネットワークとモデル関数の出力のヤコビ行列を返します。

jac = dljacobian(u,x,dim) は、指定された演算次元のデータ x に関して、ニューラルネットワークまたはモデル関数の出力 u のヤコビ行列を返します。

例

jac = dljacobian(u,x,dim,EnableHigherDerivatives=tf) は、バックワードパスをトレースして高次微分を有効にするかどうかも指定します。

例

すべて折りたたむ

深層学習データのヤコビアンの評価

ライブスクリプトを開く

ニューラルネットワークを作成します。

inputSize = [16 16 3];
numOutputChannels = 5;

layers = [
    imageInputLayer(inputSize)
    convolution2dLayer(3,64)
    reluLayer
    fullyConnectedLayer(numOutputChannels)
    softmaxLayer];

net = dlnetwork(layers);

学習データを読み込みます。この例では、ランダムデータをいくつか生成します。

numObservations = 128;
X = rand([inputSize numObservations]);
X = dlarray(X,"SSCB");

T = rand([numOutputChannels numObservations]);
T = dlarray(T,"CB");

ネットワークとデータを入力として受け取り、損失、学習可能なパラメーターに対するその損失の勾配、および入力データに関する予測のヤコビアンを返すモデル損失関数を定義します。

function [loss,gradients,jac] = modelLoss(net,X,T)

Y = forward(net,X);
loss = l1loss(Y,T);

X = stripdims(X);
Y = stripdims(Y);

jac = dljacobian(Y,X,1);
gradients = dlgradient(loss,net.Learnables);

end

dlfeval 関数を使用してモデル損失関数を評価します。

[loss,gradients,jac] = dlfeval(@modelLoss,net,X,T);

ヤコビアンのサイズを表示します。

size(jac)

ans = 1×5

     5    16    16     3   128

入力引数

すべて折りたたむ

`u` — ニューラルネットワークまたはモデル関数の出力
トレースされた `dlarray` 行列

ニューラルネットワークまたはモデル関数の出力。トレースされた dlarray 行列として指定します。

トレースされた dlarray オブジェクトは、自動微分コンテキストにおいてソフトウェアが操作する dlarray オブジェクトです。ソフトウェアは、自動微分を有効にして関数を評価すると、"トレース" と呼ばれるデータ構造に演算を記録し、そのトレースを使用して導関数を計算します。ソフトウェアが dlarray をトレースするコンテキストには次のものが含まれます。

trainnet 関数が評価する損失関数の内部
カスタム層が評価する forward 関数の内部
dlfeval 関数が評価するモデルとモデル損失関数の内部

dim 引数で指定されていない次元のサイズは同じでなければなりません。

`x` — 入力データ
トレースされた `dlarray` オブジェクト

入力データ。トレースされた dlarray オブジェクトとして指定します。

trainnet 関数が評価する損失関数の内部
カスタム層が評価する forward 関数の内部
dlfeval 関数が評価するモデルとモデル損失関数の内部

dim 引数で指定されていない次元のサイズは同じでなければなりません。

`dim` — 演算次元
正の整数

u の演算次元。正の整数として指定します。

dljacobian 関数は、データの残りの次元を独立したバッチ次元として扱います。

`tf` — 高次微分を有効にするフラグ
`true` または `1` (既定値) | `false` または `0`

高次微分を有効にするフラグ。次のいずれかの値として指定します。

数値または logical 1 (true) — 高次微分を有効にします。自動微分を使用して微分を計算する関数 (dlgradient、dljacobian、dldivergence、および dllaplacian など) をさらに呼び出したときに、返された値を計算で使用できるように、バックワードパスがトレースされます。
数値または logical 0 (false) — 高次微分を無効にします。バックワードパスはトレースされません。一次微分のみを計算する場合、このオプションを使用すると、通常、処理時間が短縮され、メモリ使用量が節約されます。

出力引数

すべて折りたたむ

`jac` — ヤコビアン
形式を整えていない `dlarray` オブジェクト

ヤコビアン。形式を整えていない dlarray オブジェクトとして返されます。

jac のレイアウトは、dim、および u と x のサイズによって決まります。

出力 jac は (N+1) 次元の配列です。ここで、N は x の次元数です。出力 jac のサイズは [szU,szX1,szX2,...,szXN] です。ここで、szU は size(u,dim) に対応し、[szX1,szX2,...,szXN] は x のサイズです。

jac の各要素は、x の要素に関する u の要素の偏微分を表します。

dim が 1 である場合、jac(i,j1,j2,...,jn) は、x(j1,j2,...,jN) に関する u(i,jk) の偏微分に対応します。ここで、jk は x のバッチ次元のインデックスです。
dim が 2 である場合、jac(i,j1,j2,...,jn) は、x(j1,j2,...,jN) に関する u(jk,i) の偏微分に対応します。ここで、jk は x のバッチ次元のインデックスです。

バージョン履歴

R2024b で導入

参考

dljacobian

構文

説明

例

深層学習データのヤコビアンの評価

入力引数

u — ニューラル ネットワークまたはモデル関数の出力 トレースされた dlarray 行列

x — 入力データ トレースされた dlarray オブジェクト

dim — 演算次元 正の整数

tf — 高次微分を有効にするフラグ true または 1 (既定値) | false または 0

出力引数

jac — ヤコビアン 形式を整えていない dlarray オブジェクト

バージョン履歴

参考

トピック

`u` — ニューラルネットワークまたはモデル関数の出力
トレースされた `dlarray` 行列

`x` — 入力データ
トレースされた `dlarray` オブジェクト

`dim` — 演算次元
正の整数

`tf` — 高次微分を有効にするフラグ
`true` または `1` (既定値) | `false` または `0`

`jac` — ヤコビアン
形式を整えていない `dlarray` オブジェクト