ボリュームの深層学習向け前処理
ボリューム データの読み取り
ボリューム イメージ データでサポートされるファイル形式には、MAT ファイル、Digital Imaging and Communications in Medicine (DICOM) ファイル、および Neuroimaging Informatics Technology Initiative (NIfTI) ファイルがあります。
ボリューム イメージ データを ImageDatastore
に読み取ります。ボリューム ピクセル ラベル データを PixelLabelDatastore
(Computer Vision Toolbox) に読み取ります。詳細については、深層学習用のデータストア (Deep Learning Toolbox)を参照してください。
この表は、サポートされている各ファイル形式での imageDatastore
と pixelLabelDatastore
の一般的な使用法を示しています。データストアを作成する場合、名前と値の引数 FileExtensions
をデータのファイル拡張子として指定します。ReadFcn
プロパティを、ファイル形式のデータを読み取る関数ハンドルとして指定します。引数 filepath
は、イメージ データが含まれるファイルまたはフォルダーのパスを指定します。ピクセル ラベル イメージの場合、追加の引数 classNames
および pixelLabelID
は、ボクセル ラベル値のクラス名へのマッピングを指定します。
イメージ ファイル形式 | イメージ データストアまたはピクセル ラベル データストアの作成 |
---|---|
MAT | volds = imageDatastore(filepath, ... "FileExtensions",".mat","ReadFcn",@(x) fcn(x)); pxds = pixelLabelDatastore(filepath,classNames,pixelLabelID, ... "FileExtensions",".mat","ReadFcn",@(x) fcn(x)); fcn は、MAT ファイルからデータを読み取るカスタム関数です。たとえば、次のコードは、MAT ファイルの最初の変数からボリューム データを読み込む matRead と呼ばれる関数を定義します。関数を matRead.m という名前のファイルに保存します。
function data = matRead(filename) inp = load(filename); f = fields(inp); data = inp.(f{1}); end |
単一のファイルの DICOM ボリューム |
volds = imageDatastore(filepath, ... "FileExtensions",".dcm","ReadFcn",@(x) dicomread(x)); pxds = pixelLabelDatastore(filepath,classNames,pixelLabelID, ... "FileExtensions",".dcm","ReadFcn",@(x) dicomread(x)); DICOM ファイルの読み取りの詳細については、 |
複数のファイルの DICOM ボリューム | 次の手順に従います。例については、単一ファイルおよび複数ファイルの DICOM シリーズを含むイメージ データストアの作成を参照してください。
|
NIfTI | volds = imageDatastore(filepath, ... "FileExtensions",".nii","ReadFcn",@(x) niftiread(x)); pxds = pixelLabelDatastore(filepath,classNames,pixelLabelID, ... "FileExtensions",".nii","ReadFcn",@(x) niftiread(x)); NIfTI ファイルの読み取りの詳細については、 |
イメージとラベル データのペアリング
セマンティック セグメンテーション用のボリューム イメージとラベル データ、または回帰用の 2 つのボリューム イメージ データストアを関連付けるには、randomPatchExtractionDatastore
を使用します。ランダム パッチ抽出データストアは、2 つのデータストアから対応するランダムに配置されたパッチを抽出します。パッチは、任意の大きさのボリュームでの学習時にメモリ不足を防ぐための一般的な手法です。ネットワークの入力サイズに一致し、メモリの効率性を考慮して、64 × 64 × 64 ボクセルなどのボリュームのフル サイズより小さいパッチ サイズを指定します。
関数 combine
を使用して 2 つのデータストアを関連付けることもできます。ただし、randomPatchExtractionDatastore
を使用して 2 つのデータストアを関連付ける方法には、combine
を使用する方法と比べていくつかの利点があります。
randomPatchExtractionDatastore
は、並列学習、マルチ GPU 学習、および事前取得読み取りをサポートします。trainingOptions
(Deep Learning Toolbox) の名前と値の引数ExecutionEnvironment
を使用して、並列学習またはマルチ GPU 学習を指定します。trainingOptions
の名前と値の引数DispatchInBackground
を使用して事前取得読み取りを指定します。事前取得読み取りには、Parallel Computing Toolbox™ が必要です。randomPatchExtractionDatastore
は、本質的にパッチ抽出をサポートします。一方、CombinedDatastore
からパッチを抽出するには、イメージをトリミングしてパッチにする独自の関数を定義し、関数transform
を使用してトリミング操作を適用しなければなりません。randomPatchExtractionDatastore
は、1 つのテスト イメージから複数のイメージ パッチを生成できます。一対多のパッチ抽出では、使用可能な学習データの量が実質的に増加します。
ボリューム データの前処理
深層学習では、データの前処理と拡張が必要になることがよくあります。たとえば、イメージの強度の正規化、イメージのコントラストの強調、またはランダムなアフィン変換の追加による過適合の防止が必要な場合があります。
ボリューム データを前処理するには、関数 transform
を使用します。transform
は、カスタム関数に定義した一連の演算に従って、"基になるデータストア" と呼ばれるデータストアによって読み取られたデータを変換し、基になるデータストアの変更された形式を作成します。Image Processing Toolbox™ には、ボリューム入力を受け入れるいくつかの関数が用意されています。関数の完全なリストについては、3 次元ボリューム イメージの処理を参照してください。多次元配列で機能する MATLAB® の関数を使用して、ボリューム イメージを前処理することもできます。
カスタム変換関数は、基になるデータストアの関数 read
によって返される形式のデータを受け入れなければなりません。
基になるデータストア | カスタム変換関数への入力形式 |
---|---|
ImageDatastore | カスタム変換関数への入力は、
詳細については、 |
PixelLabelDatastore | カスタム変換関数への入力は、
詳細については、 |
RandomPatchExtractionDatastore | カスタム変換関数への入力は、2 列の table でなければなりません。 詳細については、 |
関数 transform
は、ネットワークの入力サイズに一致するデータを返さなければなりません。関数 transform
は一対多の観測値マッピングをサポートしていません。
RandomPatchExtractionDatastore
のボリューム データにランダムなアフィン変換を適用するには、関数 transform
を使用しなければなりません。このデータストアの DataAugmentation
プロパティはボリューム データをサポートしていません。
例
イメージ データストア内のボリューム データのバッチの変換
この例では、サンプル イメージ前処理パイプラインを使用して、イメージ データストア内のボリューム データを変換する方法を示します。
MAT ファイルに保存されたボリューム イメージのセットを指定します。
filepath = fullfile(matlabroot,"toolbox","images","imdata","mristack.mat"); files = [filepath; filepath; filepath];
複数のボリューム イメージを保存するイメージ データストアを作成します。データストアの ReadSize
を 1 より大きく指定します。カスタム読み取り関数 matRead
を指定します。この関数は、この例のサポート関数の節で定義されています。
volDS = imageDatastore(files,FileExtensions=".mat", ... ReadSize=3,ReadFcn=@(x) matRead(x));
ネットワークの入力サイズを指定します。
inputSize = [128 128];
サポート関数 preprocessVolumetricIMDS
で定義されたカスタム前処理パイプラインを使用して、volDS
のボリューム イメージを前処理します。
dsTrain = transform(volDS,@(x) preprocessVolumetricIMDS(x,inputSize));
データのバッチを読み取ります。
minibatch = read(dsTrain)
minibatch=3×1 cell array
{128x128x21 uint8}
{128x128x21 uint8}
{128x128x21 uint8}
サポート関数
関数 matRead
は、MAT ファイルの最初の変数からボリューム データを読み込みます。
function data = matRead(filename) inp = load(filename); f = fields(inp); data = inp.(f{1}); end
関数 preprocessVolumetricIMDS
は、基になるイメージ データストアから読み取られたデータに対して目的の変換を実行します。イメージ データストアの読み取りサイズが 1 より大きいため、関数はイメージ データの cell 配列を受け入れなければなりません。この関数は読み取られた各イメージをループ処理し、次の前処理パイプラインに従ってデータを変換します。
z 軸を中心としてイメージをランダムに回転させる。
ボリュームのサイズをネットワークで期待されるサイズに変更する。
ガウス ノイズを加えたノイズを含むバージョンのイメージを作成する。
イメージを cell 配列で返す。
function batchOut = preprocessVolumetricIMDS(batchIn,inputSize) numRows = size(batchIn,1); batchOut = cell(numRows,1); for idx = 1:numRows % Perform randomized 90 degree rotation about the z-axis imRotated = imrotate3(batchIn{idx,1},90*(randi(4)-1),[0 0 1]); % Resize the volume to the size expected by the network imResized = imresize(imRotated,inputSize); % Add zero-mean Gaussian noise with a normalized variance of 0.01 imNoisy = imnoise(imResized,"gaussian",0.01); % Return the preprocessed data batchOut(idx) = {imNoisy}; end end
ランダム パッチ抽出データストア内のボリューム データの変換
この例では、サンプル イメージ前処理パイプラインを使用して、ランダム パッチ抽出データストア内のボリューム データのペアを変換する方法を示します。
MAT ファイルに保存された 2 セットのボリューム イメージを指定します。各セットには、5 つのボリューム イメージが格納されています。
dir = fullfile(matlabroot,"toolbox","images","imdata","BrainMRILabeled"); filesVol1 = fullfile(dir,"images"); filesVol2 = fullfile(dir,"labels");
ボリューム イメージの各セットをイメージ データストアに保存します。カスタム読み取り関数 matRead
を指定します。この関数は、この例のサポート関数の節で定義されています。既定の ReadSize
である 1 を使用します。
vol1DS = imageDatastore(filesVol1,FileExtensions=".mat",ReadFcn=@(x) matRead(x)); vol2DS = imageDatastore(filesVol2,FileExtensions=".mat",ReadFcn=@(x) matRead(x));
ネットワークの入力サイズを指定します。
inputSize = [128 128];
2 つのデータストアから対応するパッチを抽出するランダム パッチ抽出データストアを作成します。イメージごとに 3 つのパッチを選択します。
patchVolDS = randomPatchExtractionDatastore(vol1DS,vol2DS,inputSize,PatchesPerImage=3);
サポート関数 preprocessVolumetricPatchDS
で定義されたカスタム前処理パイプラインを使用して、patchVolDS
のボリューム イメージを前処理します。
dsTrain = transform(patchVolDS,@(x) preprocessVolumetricPatchDS(x));
データのバッチを読み取ります。
minibatch = read(dsTrain)
minibatch=15×2 table
InputImage ResponseImage
____________________ ___________________
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
{128x128x155 uint16} {128x128x155 uint8}
サポート関数
関数 matRead
は、MAT ファイルの最初の変数からボリューム データを読み込みます。
function data = matRead(filename) inp = load(filename); f = fields(inp); data = inp.(f{1}); end
関数 preprocessVolumetricPatchDS
は、基になるランダム パッチ抽出データストアから読み取られたデータに対して目的の変換を実行します。この関数は table を受け入れなければなりません。この関数は次の前処理パイプラインに従ってデータを変換します。
5 つの拡張のいずれかをランダムに選択する。
table の両方の列のデータに同じ拡張を適用する。
拡張されたイメージ ペアを table で返す。
function batchOut = preprocessVolumetricPatchDS(batchIn) numRows = size(batchIn,1); batchOut = batchIn; % 5 augmentations: nil,rot90,fliplr,flipud,rot90(fliplr) augType = {@(x) x,@rot90,@fliplr,@flipud,@(x) rot90(fliplr(x))}; for idx = 1:numRows img = batchIn{idx,1}{1}; resp = batchIn{idx,2}{1}; rndIdx = randi(5,1); imgAug = augType{rndIdx}(img); respAug = augType{rndIdx}(resp); batchOut(idx,:) = {imgAug,respAug}; end end
参考
trainnet
(Deep Learning Toolbox) | trainingOptions
(Deep Learning Toolbox) | dlnetwork
(Deep Learning Toolbox) | imageDatastore
| pixelLabelDatastore
(Computer Vision Toolbox) | randomPatchExtractionDatastore
| transform
関連する例
- 単一ファイルおよび複数ファイルの DICOM シリーズを含むイメージ データストアの作成
- 深層学習を使用した脳腫瘍の 3 次元セグメンテーション (Deep Learning Toolbox)
詳細
- 深層学習用のデータストア (Deep Learning Toolbox)
- MATLAB による深層学習 (Deep Learning Toolbox)
- 関数のファイルでの作成