resnet18

ResNet-18 畳み込みニューラルネットワーク

構文

net = resnet18

net = resnet18('Weights','imagenet')

lgraph = resnet18('Weights','none')

説明

ResNet-18 は、深さが 18 層の畳み込みニューラルネットワークです。100 万個を超えるイメージで学習させた事前学習済みのネットワークを、ImageNet データベース[1]から読み込むことができます。この事前学習済みのネットワークは、イメージを 1000 個のオブジェクトカテゴリ (キーボード、マウス、鉛筆、多くの動物など) に分類できます。結果として、このネットワークは広範囲のイメージに対する豊富な特徴表現を学習しています。ネットワークのイメージ入力サイズは 224 x 224 です。MATLAB^® の他の事前学習済みのネットワークについては、事前学習済みの深層ニューラルネットワークを参照してください。

classify を使用すると、ResNet-18 モデルを使用して新しいイメージを分類できます。GoogLeNet を使用したイメージの分類の手順に従って、GoogLeNet を ResNet-18 に置き換えます。

新しい分類タスクでネットワークの再学習を行うには、新しいイメージを分類するための深層学習ネットワークの学習の手順に従い、GoogLeNet の代わりに ResNet-18 を読み込みます。

ヒント

イメージ分類タスクに適した未学習の残差ネットワークを作成するには、resnetLayers を使用します。

例

net = resnet18 は、ImageNet データセットで学習させた ResNet-18 ネットワークを返します。

この関数には、Deep Learning Toolbox™ Model for ResNet-18 Network サポートパッケージが必要です。このサポートパッケージがインストールされていない場合、関数によってダウンロード用リンクが表示されます。

net = resnet18('Weights','imagenet') は、ImageNet データセットで学習させた ResNet-18 ネットワークを返します。この構文は、net = resnet18 と等価です。

lgraph = resnet18('Weights','none') は、未学習の ResNet-18 ネットワークアーキテクチャを返します。未学習のモデルは、サポートパッケージを必要としません。

例

すべて折りたたむ

ResNet-18 サポートパッケージのダウンロード

Deep Learning Toolbox Model for ResNet-18 Network サポートパッケージをダウンロードしてインストールします。

コマンドラインで resnet18 と入力します。

resnet18

Deep Learning Toolbox Model for ResNet-18 Network サポートパッケージがインストールされていない場合、関数によってアドオンエクスプローラーに必要なサポートパッケージへのリンクが表示されます。サポートパッケージをインストールするには、リンクをクリックして、[インストール] をクリックします。コマンドラインで resnet18 と入力して、インストールが正常に終了していることを確認します。必要なサポートパッケージがインストールされている場合、関数によって DAGNetwork オブジェクトが返されます。

resnet18

ans = 

  DAGNetwork with properties:

         Layers: [72×1 nnet.cnn.layer.Layer]
    Connections: [79×2 table]

ディープネットワークデザイナーを使用してネットワークを可視化します。

deepNetworkDesigner(resnet18)

ディープネットワークデザイナーで [新規] をクリックし、事前学習済みの他のニューラルネットワークを探索します。

Deep Network Designer start page showing available pretrained neural networks

ニューラルネットワークをダウンロードする必要がある場合は、目的のニューラルネットワークで一時停止し、[インストール] をクリックしてアドオンエクスプローラーを開きます。

ResNet-18 を使用したイメージの分類

この例では次を使用します。

ライブスクリプトを開く

事前学習済みの ResNet-18 モデルを読み込みます。

net = resnet18;

imread を使用してテストイメージを読み取ります。

I = imread("peppers.png");
imshow(I)

Figure contains an axes object. The axes object contains an object of type image.

事前学習済みのモデルは、イメージサイズがネットワークの入力サイズと同じである必要があります。ネットワークの最初の層の InputSize プロパティを使用して、ネットワークの入力サイズを求めます。

sz = net.Layers(1).InputSize

sz = 1×3

   224   224     3

イメージのサイズをネットワークの入力サイズに変更します。

I = imresize(I,sz(1:2));

classify を使用してイメージを分類します。

label = classify(net,I)

label = categorical
     bell pepper

イメージと分類結果をまとめて表示します。

imshow(I)
title(label)

Figure contains an axes object. The axes object with title bell pepper contains an object of type image.

ResNet-18 を使用した対話型の転移学習

この例では次を使用します。

ライブスクリプトを開く

ワークスペースで、MathWorks Merch データセットを解凍します。

unzip("MerchData.zip");

ディープネットワークデザイナーを開いて、利用可能な事前学習済みネットワークを確認します。

deepNetworkDesigner

[ResNet-18] を選択し、[開く] をクリックします。Deep Learning Toolbox™ Model for ResNet-18 Network がインストールされていない場合、ソフトウェアは "アドオンエクスプローラー" を開きます。

ディープネットワークデザイナーにデータを読み込むには、[データ] タブで、[データのインポート]、[イメージ分類データのインポート] をクリックします。[データソース] リストの [フォルダー] を選択します。[参照] をクリックし、解凍した MerchData フォルダーを選択します。

データを学習データセットと検証データセットに分割します。イメージの 70% を学習に使用し、30% を検証に使用します。[ランダム化] を選択し、指定した割合でイメージを検証セットと学習セットにランダムに割り当てます。

[インポート] をクリックして、ディープネットワークデザイナーにデータをインポートします。

インポートされたデータの概要がアプリによって表示されます。

新しいイメージを分類するように事前学習済みのネットワークに再学習させるには、最後の学習可能な層と最終分類層を新しいデータセットに適応させます。

[デザイナー] タブで最後の全結合層をクリックします。[プロパティ] ペインの下部で、[層のロックを解除] をクリックします。表示される警告ダイアログで、[ロックの強制解除] をクリックします。これにより層のプロパティのロックが解除され、それらを新しいタスクに適応できるようになります。

R2023b より前: 層のプロパティを編集するには、層のロックを解除するのではなく、層を置き換えなければなりません。

OutputSize を新しいデータのクラス数 (この例では 5) に設定します。学習率を編集して、新しい層での学習速度を転移層より速くします。WeightLearnRateFactor および BiasLearnRateFactor を 10 に設定します。

分類層を選択し、[層のロックを解除] をクリックしてから、[ロックの強制解除] をクリックします。ロックが解除された出力層に対して OutputSize を設定する必要はありません。学習時に、ディープネットワークデザイナーによって層の出力クラスがデータから自動的に設定されます。

学習オプションを指定します。[学習] タブを選択し、[学習オプション] をクリックします。[Solver] を sgdm、[InitialLearnRate] を 0.0001、[MiniBatchSize] を 11、[MaxEpochs] を 8、[ValidationFrequency] を 5 に設定します。

指定した学習オプションでネットワークに学習させるには、[OK] をクリックしてから [学習] をクリックします。

学習した重みを含むネットワークアーキテクチャをエクスポートするには、[学習] タブの [エクスポート]、[学習済みネットワークと結果のエクスポート] を選択します。ディープネットワークデザイナーによって、学習済みネットワークが変数 trainedNetwork_1 としてエクスポートされます。

学習済みネットワークを使用して分類する新しいイメージを読み込みます。

I = imread("MerchDataTest.jpg");

イメージサイズは学習の間、ネットワークの入力サイズに合うようにディープネットワークデザイナーにより変更されます。ネットワークの入力サイズを確認するには、[デザイナー] ペインに移動して imageInputLayer (最初の層) を選択します。このネットワークの入力サイズは 224 x 224 です。

ネットワークの入力サイズに合うようにテストイメージをサイズ変更します。

I = imresize(I,[224 224]);

学習済みネットワークを使用してテストイメージを分類します。

YPred = classify(trainedNetwork_1,I);
imshow(I)
title("Predicted Class: " + string(YPred));

ResNet-18 を使用したプログラムによる転移学習

この例では次を使用します。

ライブスクリプトを開く

事前学習済みの ResNet-18 ニューラルネットワークを読み込み、入力サイズを求めます。

net = resnet18;
inputSize = net.Layers(1).InputSize;

MathWorks Merch データセットを抽出します。新しいイメージをイメージデータストアとして読み込みます。

unzip("MerchData.zip");
imds = imageDatastore("MerchData", ...
    IncludeSubfolders=true, ...
    LabelSource="foldernames");

numClasses = numel(categories(imds.Labels));

データを学習データセットと検証データセットに分割します。"randomized" を選択し、指定した割合でイメージを検証セットと学習セットにランダムに割り当てます。

[imdsTrain,imdsValidation] = splitEachLabel(imds,0.7,"randomized");

拡張イメージデータストアを使用して、ネットワークの入力サイズに一致するように学習イメージのサイズを自動的に変更します。

augimdsTrain = augmentedImageDatastore(inputSize(1:2),imdsTrain);
augimdsValidation = augmentedImageDatastore(inputSize(1:2),imdsValidation);

事前学習済みのネットワークに再学習させて新しいイメージを分類するには、最後の全結合層と最終分類層を、新しいデータセットに適応した新しい層に置き換えます。まず、学習済みのネットワークから層グラフを抽出します。

lgraph = layerGraph(net);

全結合層を、クラスの数と同じ数の出力をもつ新しい全結合層に置き換えます。新しい層での学習速度を転移層より速くするには、全結合層の WeightLearnRateFactor および BiasLearnRateFactor の値を大きくします。

newLearnableLayer = fullyConnectedLayer(numClasses, ...
    WeightLearnRateFactor=10, ...
    BiasLearnRateFactor=10);
    
lgraph = replaceLayer(lgraph,"fc1000",newLearnableLayer);

分類層はネットワークの出力クラスを指定します。分類層をクラスラベルのない新しい層に置き換えます。trainNetwork は、学習時に層の出力クラスを自動的に設定します。

newClassLayer = classificationLayer;
lgraph = replaceLayer(lgraph,"ClassificationLayer_predictions",newClassLayer);

学習オプションを指定します。転移層での学習速度を下げるため、初期学習率を小さい値に設定します。

options = trainingOptions("sgdm", ...
    InitialLearnRate=0.0001, ...
    MiniBatchSize=11, ...
    MaxEpochs=8, ...
    ValidationData=augimdsValidation, ...
    ValidationFrequency=5, ...
    Verbose=false, ...
    Plots="training-progress");

ネットワークに学習をさせます。

trainedNetwork = trainNetwork(augimdsTrain,lgraph,options);

Figure Training Progress (29-Aug-2023 21:12:57) contains 2 axes objects and another object of type uigridlayout. Axes object 1 with xlabel Iteration, ylabel Loss contains 15 objects of type patch, text, line. Axes object 2 with xlabel Iteration, ylabel Accuracy (%) contains 15 objects of type patch, text, line.

学習済みネットワークを使用して分類する新しいイメージを読み込みます。

I = imread("MerchDataTest.jpg");
I = imresize(I,inputSize(1:2));

テストイメージを分類します。

YPred = classify(trainedNetwork,I);
imshow(I)
title("Predicted class: " + string(YPred));

Figure contains an axes object. The axes object with title Predicted class: MathWorks Cube contains an object of type image.

出力引数

すべて折りたたむ

`net` — 事前学習済みの ResNet-18 畳み込みニューラルネットワーク
`DAGNetwork` オブジェクト

事前学習済みの ResNet-18 畳み込みニューラルネットワーク。DAGNetwork オブジェクトとして返されます。

`lgraph` — 未学習の ResNet-18 畳み込みニューラルネットワークアーキテクチャ
`LayerGraph` オブジェクト

未学習の ResNet-18 畳み込みニューラルネットワークアーキテクチャ。LayerGraph オブジェクトとして返されます。

参照

[1] ImageNet. http://www.image-net.org

[2] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. "Deep residual learning for image recognition." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 770-778. 2016.

拡張機能

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

コード生成の場合、構文 net = resnet18 を使用するか、関数 resnet18 を coder.loadDeepLearningNetwork (MATLAB Coder) に渡すことによって、ネットワークを読み込むことができます。次に例を示します。net = coder.loadDeepLearningNetwork('resnet18')

詳細については、コード生成のための事前学習済みネットワークの読み込み (MATLAB Coder)を参照してください。

構文 resnet18('Weights','none') はコード生成でサポートされていません。

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

使用上の注意および制限:

コード生成の場合、構文 net = resnet18 を使用するか、関数 resnet18 を coder.loadDeepLearningNetwork (GPU Coder) に渡すことによって、ネットワークを読み込むことができます。次に例を示します。net = coder.loadDeepLearningNetwork('resnet18')
詳細については、コード生成用の事前学習済みのネットワークの読み込み (GPU Coder)を参照してください。
構文 resnet18('Weights','none') は GPU コード生成でサポートされていません。

バージョン履歴

R2018a で導入

参考

resnet18

構文

説明

例

ResNet-18 サポート パッケージのダウンロード

ResNet-18 を使用したイメージの分類

ResNet-18 を使用した対話型の転移学習

ResNet-18 を使用したプログラムによる転移学習

出力引数

net — 事前学習済みの ResNet-18 畳み込みニューラル ネットワーク DAGNetwork オブジェクト

lgraph — 未学習の ResNet-18 畳み込みニューラル ネットワーク アーキテクチャ LayerGraph オブジェクト

参照

拡張機能

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU コード生成 GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

バージョン履歴

参考

トピック

ResNet-18 サポートパッケージのダウンロード

`net` — 事前学習済みの ResNet-18 畳み込みニューラルネットワーク
`DAGNetwork` オブジェクト

`lgraph` — 未学習の ResNet-18 畳み込みニューラルネットワークアーキテクチャ
`LayerGraph` オブジェクト

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。