ディープネットワークデザイナーへのデータのインポート

メモ

ディープネットワークデザイナーを使用してデータをインポートし、ネットワークに学習させることは推奨されません。

ディープネットワークデザイナーで学習データと検証データをインポートして可視化するには、従来の構文 deepNetworkDesigner("-v1") を使用します。

データのインポート

ディープネットワークデザイナーでは、イメージデータストア、または各クラスからのイメージのサブフォルダーを含むフォルダーから、イメージ分類データをインポートできます。使用するデータストアのタイプに基づいてインポート方法を選択します。

ImageDatastore オブジェクトのインポートその他のデータストアオブジェクトのインポート (ImageDatastore には非推奨)

`ImageDatastore` オブジェクトのインポート	その他のデータストアオブジェクトのインポート (`ImageDatastore` には非推奨)
[データのインポート] 、 [イメージ分類データのインポート] を選択します。	[データのインポート] 、 [カスタムデータのインポート] を選択します。

[データのインポート] 、 [イメージ分類データのインポート] を選択します。

Import Image Classification Data dialog. Using this dialog, you can select the source of image classification data, specify augmentation options, and split validation data.

[データのインポート] 、 [カスタムデータのインポート] を選択します。

Import Custom Data dialog. Using this dialog, you can import training and validation data sets.

データのタスク別のインポート

タスク	データ型	データのインポート方法
イメージ分類	クラスごとのイメージを含むサブフォルダーのあるフォルダー。クラスラベルは、サブフォルダー名から取得されます。	[データのインポート] 、 [イメージ分類データのインポート] を選択します。
	`ImageDatastore` たとえば、数字データを含むイメージデータストアを作成します。 unzip("DigitsData.zip"); dataFolder = "DigitsData"; imds = imageDatastore(dataFolder, ... IncludeSubfolders=true, ... LabelSource="foldernames");	[データのインポート] 、 [イメージ分類データのインポート] を選択します。
	`augmentedImageDatastore` たとえば、数字データを含む拡張されたイメージデータストアを作成します。 unzip("DigitsData.zip"); dataFolder = "DigitsData"; imds = imageDatastore(dataFolder, ... IncludeSubfolders=true, ... LabelSource="foldernames"); imageAugmenter = imageDataAugmenter( ... 'RandRotation',[1,2]); augimds = augmentedImageDatastore([28 28],imds, ... 'DataAugmentation',imageAugmenter); augimds = shuffle(augimds);	[データのインポート] 、 [カスタムデータのインポート] を選択します。
セマンティックセグメンテーション	`CombinedDatastore` たとえば、`ImageDatastore` と `PixelLabelDatastore` (Computer Vision Toolbox) を結合します。 dataFolder = fullfile(toolboxdir('vision'), ... 'visiondata','triangleImages'); imageDir = fullfile(dataFolder,'trainingImages'); labelDir = fullfile(dataFolder,'trainingLabels'); imds = imageDatastore(imageDir); classNames = ["triangle","background"]; labelIDs = [255 0]; pxds = pixelLabelDatastore(labelDir,classNames,labelIDs); cds = combine(imds,pxds);	[データのインポート] 、 [カスタムデータのインポート] を選択します。
image-to-image 回帰	`CombinedDatastore` たとえば、ノイズを含む入力イメージと初期状態の出力イメージを組み合わせて、image-to-image 回帰に適したデータを作成します。 unzip("DigitsData.zip"); dataFolder = "DigitsData"; imds = imageDatastore(dataFolder, ... IncludeSubfolders=true, ... LabelSource="foldernames"); imds = transform(imds,@(x) rescale(x)); imdsNoise = transform(imds,@(x) {imnoise(x,'Gaussian',0.2)}); cds = combine(imdsNoise,imds); cds = shuffle(cds);	[データのインポート] 、 [カスタムデータのインポート] を選択します。
回帰	`CombinedDatastore` 配列データストアオブジェクトを組み合わせて、回帰ネットワークの学習に適したデータを作成します。 [XTrain,~,YTrain] = digitTrain4DArrayData; ads = arrayDatastore(XTrain,'IterationDimension',4, ... 'OutputType','cell'); adsAngles = arrayDatastore(YTrain,'OutputType','cell'); cds = combine(ads,adsAngles);	[データのインポート] 、 [カスタムデータのインポート] を選択します。
シーケンスおよび時系列	`CombinedDatastore` シーケンスデータを予測子のデータストアから深層学習ネットワークに入力するには、シーケンスのミニバッチが同じ長さでなければなりません。関数 `padsequences` を使用すると、指定した長さになるようにシーケンスのパディングまたは切り捨てを行うことができます。たとえば、すべてのシーケンスが最長のシーケンスと同じ長さになるようにシーケンスをパディングします。 [XTrain,YTrain] = japaneseVowelsTrainData; XTrain = padsequences(XTrain,2); adsXTrain = arrayDatastore(XTrain,'IterationDimension',3); adsYTrain = arrayDatastore(YTrain); cdsTrain = combine(adsXTrain,adsYTrain); パディングの量を減らすには、変換されたデータストアと補助関数を使用します。たとえば、ミニバッチのすべてのシーケンスがそのミニバッチにある最長のシーケンスと同じ長さになるようにシーケンスをパディングします。また、学習オプションでは同じミニバッチサイズを使用しなければなりません。 [XTrain,TTrain] = japaneseVowelsTrainData; miniBatchSize = 27; adsXTrain = arrayDatastore(XTrain,'OutputType',"same",'ReadSize',miniBatchSize); adsTTrain = arrayDatastore(TTrain,'ReadSize',miniBatchSize); tdsXTrain = transform(adsXTrain,@padToLongest); cdsTrain = combine(tdsXTrain,adsTTrain); function data = padToLongest(data) sequence = padsequences(data,2,Direction="left"); for n = 1:numel(data) data{n} = sequence(:,:,n); end end データを短い順に並べ替えてパディングの量を減らしたり、パディングの向きを指定してパディングの影響を減らしたりすることもできます。シーケンスデータのパディングの詳細については、シーケンスのパディングと切り捨てを参照してください。カスタムデータストアオブジェクトを使用してシーケンスデータをインポートすることもできます。カスタムシーケンスデータストアを作成する方法を示す例については、シーケンスデータのカスタムミニバッチデータストアを使用したネットワークの学習を参照してください。	[データのインポート] 、 [カスタムデータのインポート] を選択します。
その他の拡張ワークフロー (数値特徴入力、メモリ外のデータ、イメージ処理、オーディオ処理および音声処理など)	データストアその他の拡張ワークフローでは、適切なデータストアオブジェクトを使用してください。たとえば、カスタムデータストア、`randomPatchExtractionDatastore` (Image Processing Toolbox)、`denoisingImageDatastore` (Image Processing Toolbox)、または `audioDatastore` (Audio Toolbox) が挙げられます。詳細については、深層学習用のデータストアを参照してください。たとえば、Image Processing Toolbox™ を使用して、`denoisingImageDatastore` オブジェクトを作成します。 dataFolder = fullfile(toolboxdir('images'),'imdata'); imds = imageDatastore(dataFolder,'FileExtensions',{'.jpg'}); dnds = denoisingImageDatastore(imds,... 'PatchesPerImage',512,... 'PatchSize',50,... 'GaussianNoiseLevel',[0.01 0.1]); table 配列データの場合、ディープネットワークデザイナーを使用して学習させるには、データを適切なデータストアに変換しなければなりません。たとえば、最初に予測子と応答を含む配列に table を変換します。次に、この配列を `arrayDatastore` オブジェクトに変換します。最後に、予測子と応答を含む配列データストアを `CombinedDatastore` オブジェクトに結合します。これで、結合されたデータストアを使用してディープネットワークデザイナーで学習を行えるようになります。適切なデータストアの詳細については、深層学習用のデータストアを参照してください。	[データのインポート] 、 [カスタムデータのインポート] を選択します。

イメージ拡張

イメージ分類問題について、ディープネットワークデザイナーは、学習データに適用する単純な拡張オプションを提供しています。[データのインポート] 、 [イメージ分類データのインポート] を選択して、[イメージ分類データのインポート] ダイアログボックスを開きます。反射、回転、再スケーリング、平行移動といった操作のランダムな組み合わせを学習データに適用するオプションを選択できます。

Import Image Classification Data dialog. Using this dialog, you can select the source of image classification data, specify augmentation options, and split validation data.

ディープネットワークデザイナーが提供するイメージ前処理演算より一般的で複雑なイメージ前処理演算を実行するには、TransformedDatastore オブジェクトおよび CombinedDatastore オブジェクトを使用します。CombinedDatastore オブジェクトおよび TransformedDatastore オブジェクトをインポートするには、[データのインポート] 、 [カスタムデータのインポート] を選択します。

Import Custom Data dialog. Using this dialog, you can import training and validation data sets.

イメージ拡張の詳細については、イメージの深層学習向け前処理を参照してください。

検証データ

ディープネットワークデザイナーでは、使用する検証データを学習中にインポートできます。損失や精度などの検証メトリクスを監視して、ネットワークが過適合または適合不足かどうかを評価し、必要に応じて学習オプションを調整できます。たとえば、検証損失が学習損失をはるかに上回っている場合、ネットワークは過適合している可能性があります。

Loss plot showing the training and validation loss versus iteration number. The validation loss is much higher than the training loss.

ディープネットワークデザイナーでは、次のように検証データをインポートできます。

ワークスペース内のデータストアから。
クラスごとのイメージのサブフォルダーを含むフォルダーから (イメージ分類データのみ)。
検証データとして使用する学習データの一部を分割することによって (イメージ分類データのみ)。学習を行う前に、一度、データを検証セットと学習セットに分割します。この手法はホールドアウト検証と呼ばれます。

検証データの学習データからの分割

学習データからホールドアウト検証データを分割する際、ディープネットワークデザイナーは、各クラスから一定の割合の学習データを分割します。たとえば、cat と dog という 2 つのクラスをもつデータセットがあり、検証用に学習データの 30% を使用することを選択したとします。ディープネットワークデザイナーは、ラベル "cat" をもつイメージの最後の 30% とラベル "dog" をもつイメージの最後の 30% を検証セットとして使用します。

学習データの最後の 30% を検証データとして使用するのではなく、学習セットと検証セットに観測値をランダムに割り当てるという選択もできます。その場合、[イメージデータのインポート] ダイアログボックスの [ランダム化] チェックボックスをオンにします。イメージをランダム化することで、非ランダムな順序で保存されたデータで学習したネットワークの精度を向上させることができます。たとえば、数字データセットは、手書き数字の合成グレースケールイメージ 10,000 個で構成されています。このデータセットには、同じスタイルの手書きイメージは各クラス内で隣り合うという、基となる順序があります。表示例を示します。

Six images of a handwritten number three. The first three images share the same handwriting and the latter three images share the same handwriting.

参考

ディープ ネットワーク デザイナーへのデータのインポート

データのインポート

イメージ拡張

検証データ

検証データの学習データからの分割

参考

トピック

ディープネットワークデザイナーへのデータのインポート