deeplabv3plus

セマンティックイメージセグメンテーション用の DeepLab v3+ 畳み込みニューラルネットワークの作成

R2024a 以降

ページ内をすべて折りたたむ

構文

deepLabNetwork = deeplabv3plus(imageSize,numClasses,network)

deepLabNetwork = deeplabv3plus(___,DownsamplingFactor=value)

説明

deepLabNetwork = deeplabv3plus(imageSize,numClasses,network) は、指定されたベースネットワーク、クラス数、およびイメージサイズをもつ DeepLab v3+ 層を返します。

例

deepLabNetwork = deeplabv3plus(___,DownsamplingFactor=value) はさらに、ダウンサンプリング係数 (出力ストライド) [1]を 8 または 16 に設定します。ダウンサンプリング係数は、DeepLab v3+ の符号化器セクションが入力イメージをダウンサンプリングする量を設定します。

例

すべて折りたたむ

ResNet-18 ベースの DeepLab v3+ ネットワークの作成

この例では次を使用します。

ライブスクリプトを開く

ResNet-18 ベースの DeepLab v3+ ネットワークを作成します。

imageSize = [480 640 3];
numClasses = 5;
network = "resnet18";
net = deeplabv3plus(imageSize,numClasses,network, ...
             DownsamplingFactor=16);

ネットワークを表示します。

analyzeNetwork(net)

DeepLab v3+ ネットワークの学習

この例では次を使用します。

ライブスクリプトを開く

イメージデータストアを使用して、三角形データセットのイメージを読み込みます。データストアには、ランダムな三角形のグレースケールイメージが 200 個格納されています。各イメージは 32×32 です。

dataSetDir = fullfile(toolboxdir("vision"),"visiondata","triangleImages");
imageDir = fullfile(dataSetDir,"trainingImages");
imds = imageDatastore(imageDir);

ピクセルラベルデータストアを使用して、三角形データセットのピクセルラベルを読み込みます。

labelDir = fullfile(dataSetDir, "trainingLabels");
classNames = ["triangle","background"];
labelIDs   = [255 0];
pxds = pixelLabelDatastore(labelDir,classNames,labelIDs);

DeepLab v3+ ネットワークを作成します。

imageSize = [256 256];
numClasses = numel(classNames);
net = deeplabv3plus(imageSize,numClasses,"resnet18");

イメージとピクセルラベルデータを学習用に組み合わせ、前処理変換を適用して学習イメージのサイズを変更します。

cds = combine(imds,pxds);
tds = transform(cds, @(data)preprocessTrainingData(data,imageSize));

学習オプションを指定します。ミニバッチサイズを小さくして、メモリ使用量を減らします。

opts = trainingOptions("sgdm",...
    MiniBatchSize=8,...
    MaxEpochs=3);

ネットワークに学習をさせます。

net = trainnet(tds,net,"crossentropy",opts);

    Iteration    Epoch    TimeElapsed    LearnRate    TrainingLoss
    _________    _____    ___________    _________    ____________
            1        1       00:00:04         0.01         0.93844
           50        2       00:04:09         0.01        0.033749
           75        3       00:05:35         0.01        0.026353
Training stopped: Max epochs completed

テストイメージを読み取ります。

I = imread("triangleTest.jpg");

入力イメージサイズを 32 で割った値に等しい因数でテストイメージをサイズ変更し、テストイメージの三角形と学習時の三角形のサイズがほぼ等しくなるようにします。

I = imresize(I,Scale=imageSize./32);

イメージをセグメント化します。

C = semanticseg(I,net);

結果を表示します。

B = labeloverlay(I,C);
figure
imshow(B)

Figure contains an axes object. The axes object contains an object of type image.

サポート関数

function data = preprocessTrainingData(data, imageSize)
% Resize the training image and associated pixel label image.
data{1} = imresize(data{1},imageSize);
data{2} = imresize(data{2},imageSize);

% Convert grayscale input image into RGB for use with ResNet-18, which
% requires RGB image input.
data{1} = repmat(data{1},1,1,3);
end

入力引数

すべて折りたたむ

`imageSize` — ネットワーク入力のイメージサイズ
2 要素ベクトル | 3 要素ベクトル

ネットワーク入力のイメージサイズ。以下として指定します。

[height, width] の形式の 2 要素ベクトル。
[height, width, 3] の形式の 3 要素ベクトル。3 番目の要素 3 は、RGB に対応します。

`numClasses` — クラス数
1 より大きい整数

ネットワークが分類するクラス数。1 より大きい整数として指定します。

`network` — ベースネットワーク
`'resnet18'` | `'resnet50'` | `'mobilenetv2'` | `'xception'` | `'inceptionresnetv2'`

ベースネットワーク。resnet18 (Deep Learning Toolbox)、resnet50 (Deep Learning Toolbox)、mobilenetv2 (Deep Learning Toolbox)、xception (Deep Learning Toolbox)、または inceptionresnetv2 (Deep Learning Toolbox) として指定します。対応するネットワークアドオンをインストールしなければなりません。

出力引数

すべて折りたたむ

`deepLabNetwork` — DeepLab v3+ ネットワーク
`dlnetwork` オブジェクト

DeepLab v3+ ネットワーク。セマンティックイメージセグメンテーション用の dlnetwork (Deep Learning Toolbox) オブジェクトとして返されます。ネットワークは、符号化器-復号化器アーキテクチャ、膨張畳み込み、およびスキップ接続を使用してイメージをセグメント化します。ネットワークをセマンティックセグメンテーション用に使用する前に、関数 trainnet (Deep Learning Toolbox) (Deep Learning Toolbox™ が必要) を使用してネットワークに学習させなければなりません。

アルゴリズム

xception (Deep Learning Toolbox) ベースネットワークまたは mobilenetv2 (Deep Learning Toolbox) ベースネットワークのいずれかを使用して DeepLab v3+ ネットワークを作成する場合、深さ方向に分離可能な畳み込みがアトラス空間ピラミッドプーリング (ASPP) および復号化器サブネットワークで使用されます。他のすべてのベースネットワークでは、畳み込み層が使用されます。
この DeepLab v3+ の実装には、ASPP にグローバル平均プーリング層が含まれていません。

参照

[1] Chen, L., Y. Zhu, G. Papandreou, F. Schroff, and H. Adam. "Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation." Computer Vision — ECCV 2018, 833-851. Munic, Germany: ECCV, 2018.

拡張機能

すべて展開する

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

使用上の注意および制限:

コード生成では、まず関数 deeplabv3plus を使用して DeepLab v3+ ネットワークを作成しなければなりません。次に、結果の dlnetwork オブジェクトに関数 trainnet (Deep Learning Toolbox) を使用し、セグメンテーションについてネットワークに学習させます。ネットワークの学習と評価が済んだら、GPU Coder™ を使用して深層学習ネットワークオブジェクトのコードを生成できます。

バージョン履歴

R2024a で導入

参考

オブジェクト

dlnetwork (Deep Learning Toolbox)

関数

trainnet (Deep Learning Toolbox) | unet | unet3d | semanticseg

トピック

深層学習を使用したセマンティックセグメンテーション入門
MATLAB による深層学習 (Deep Learning Toolbox)

deeplabv3plus

構文

説明

例

ResNet-18 ベースの DeepLab v3+ ネットワークの作成

DeepLab v3+ ネットワークの学習

入力引数

imageSize — ネットワーク入力のイメージ サイズ 2 要素ベクトル | 3 要素ベクトル

numClasses — クラス数 1 より大きい整数

network — ベース ネットワーク 'resnet18' | 'resnet50' | 'mobilenetv2' | 'xception' | 'inceptionresnetv2'

出力引数

deepLabNetwork — DeepLab v3+ ネットワーク dlnetwork オブジェクト

アルゴリズム

参照

拡張機能

GPU コード生成 GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。

バージョン履歴

参考

オブジェクト

関数

トピック

`imageSize` — ネットワーク入力のイメージサイズ
2 要素ベクトル | 3 要素ベクトル

`numClasses` — クラス数
1 より大きい整数

`network` — ベースネットワーク
`'resnet18'` | `'resnet50'` | `'mobilenetv2'` | `'xception'` | `'inceptionresnetv2'`

`deepLabNetwork` — DeepLab v3+ ネットワーク
`dlnetwork` オブジェクト

GPU コード生成
GPU Coder™ を使用して NVIDIA® GPU のための CUDA® コードを生成します。