イメージ分類入門

ライブスクリプトを開く

この例では、ディープネットワークデザイナーアプリを使用して深層学習による分類用のシンプルな畳み込みニューラルネットワークを作成する方法を示します。畳み込みニューラルネットワークは深層学習に不可欠なツールであり、特にイメージの認識に適しています。

イメージデータの読み込み

数字のサンプルデータをイメージデータストアとして読み込みます。このデータにアクセスするには、例をライブスクリプトとして開きます。関数 imageDatastore は、フォルダー名に基づいてイメージに自動的にラベルを付けます。データセットには 10 個のクラスがあり、データセット内の各イメージは 28 x 28 x 1 ピクセルです。

unzip("DigitsData.zip")

imds = imageDatastore("DigitsData", ...
    IncludeSubfolders=true, ...
    LabelSource="foldernames");

classNames = categories(imds.Labels);

データを学習データセット、検証データセット、テストデータセットに分割します。イメージの 70% は学習に使用し、15% は検証に使用し、15% はテストに使用します。"randomized" を指定し、各クラスの指定された割合のファイルを新しいデータセットに割り当てます。関数 splitEachLabel は、イメージデータストアを 3 つの新しいデータストアに分割します。

[imdsTrain,imdsValidation,imdsTest] = splitEachLabel(imds,0.7,0.15,0.15,"randomized");

ネットワークアーキテクチャの定義

ネットワークを構築するには、ディープネットワークデザイナーアプリを使用します。

deepNetworkDesigner

空のネットワークを作成するには、[空のネットワーク] で [新規] をクリックします。

[デザイナー] ペインで、畳み込みニューラルネットワークアーキテクチャを定義します。[層のライブラリ] から層をドラッグして結合します。層をすばやく検索するには、[層のライブラリ] ペインの [層のフィルター] 検索ボックスを使用します。層のプロパティを編集するには、層をクリックして、[プロパティ] ペインで値を編集します。

これらの層を順番にドラッグして、順に結合します。まず、[imageInputLayer] をキャンバスにドラッグし、[InputSize] を 28,28,1 に設定します。

次に、以下の層をキャンバスにドラッグし、順番に結合します。

convolution2dLayer
batchNormalizationLayer
reluLayer

次に、[fullyConnectedLayer] を結合し、[OutputSize] をデータのクラス数 (この例では 10) に設定します。

最後に [softmaxLayer] を追加します。

ネットワークの学習の準備が整っていることを確認するには、[解析] をクリックします。深層学習ネットワークアナライザーによってエラーや警告が報告されていないため、ネットワークの学習の準備は整っています。ネットワークをエクスポートするには、[エクスポート] をクリックします。アプリはネットワークを変数 net_1 として保存します。

学習オプションの指定

学習オプションを指定します。オプションの中から選択するには、経験的解析が必要です。実験を実行してさまざまな学習オプションの構成を調べるには、実験マネージャーアプリを使用できます。

options = trainingOptions("sgdm", ...
    MaxEpochs=4, ...
    ValidationData=imdsValidation, ...
    ValidationFrequency=30, ...
    Plots="training-progress", ...
    Metrics="accuracy", ...
    Verbose=false);

ニューラルネットワークの学習

関数trainnetを使用してニューラルネットワークに学習させます。分類が目的なので、クロスエントロピー損失を使用します。

net = trainnet(imdsTrain,net_1,"crossentropy",options);

ニューラルネットワークのテスト

ニューラルネットワークをテストするには、検証データを分類し、分類精度を計算します。

関数minibatchpredictを使用して予測を行い、関数scores2labelを使用してスコアをラベルに変換します。既定では、関数 minibatchpredict は利用可能な GPU がある場合にそれを使用します。

scores = minibatchpredict(net,imdsValidation);
YValidation = scores2label(scores,classNames);

分類精度を計算します。精度は、正しく予測されたラベルの割合です。

TValidation = imdsValidation.Labels;
accuracy = mean(YValidation == TValidation)

accuracy = 0.9780

予測の一部を可視化します。

numValidationObservations = numel(imdsValidation.Files);
idx = randi(numValidationObservations,9,1);

figure
tiledlayout("flow")
for i = 1:9
    nexttile
    img = readimage(imdsValidation,idx(i));
    imshow(img)
    title("Predicted Class: " + string(YValidation(idx(i))))
end