convolution1dLayer

1 次元畳み込み層

R2021b 以降

このページをすべて展開する

説明

1 次元畳み込み層は、1 次元入力にスライディング畳み込みフィルターを適用します。この層では、入力に沿ってフィルターを移動させ、重みと入力のドット積を計算し、バイアス項を加算することによって、入力を畳み込みます。

層が畳み込みを行う次元は、層の入力によって次のように異なります。

時系列とベクトルシーケンスの入力 (チャネル、観測値、およびタイムステップに対応する 3 次元のデータ) の場合、層は時間次元で畳み込みます。
1 次元イメージ入力 (空間ピクセル、チャネル、および観測値に対応する 3 次元のデータ) の場合、層は空間次元で畳み込みます。
1 次元シーケンス入力 (空間ピクセル、チャネル、観測値、およびタイムステップに対応する 4 次元のデータ) の場合、層は空間次元で畳み込みます。

作成

構文

layer = convolution1dLayer(filterSize,numFilters)

layer = convolution1dLayer(filterSize,numFilters,Name=Value)

説明

例

layer = convolution1dLayer(filterSize,numFilters) は、1 次元畳み込み層を作成し、FilterSize プロパティおよび NumFilters プロパティを設定します。

layer = convolution1dLayer(filterSize,numFilters,Name=Value) は、さらに、1 つ以上の名前と値の引数を使用して、オプションの Stride、DilationFactor、NumChannels、パラメーターと初期化、学習率および正則化、および Name プロパティを設定します。入力のパディングを指定するには、名前と値の引数 Padding を使用します。たとえば、convolution1dLayer(11,96,Padding=1) は、サイズが 11 である 96 個のフィルターをもつ 1 次元畳み込み層を作成し、層の入力の左右にサイズ 1 のパディングを指定します。

入力引数

すべて展開する

名前と値の引数

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで、Name は引数名で、Value は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。

例: convolution1dLayer(11,96,Padding=1) は、サイズが 11 である 96 個のフィルターをもつ 1 次元畳み込み層を作成し、層の入力の左右にサイズ 1 のパディングを指定します。

`Padding` — 入力に適用するパディング
`[0 0]` (既定値) | `"same"` | `"causal"` | 非負の整数 | 非負の整数のベクトル

入力に適用するパディング。次のいずれかとして指定します。

"same" — 出力のサイズが ceil(inputSize/stride) となるようにパディングを適用します。ここで、inputSize は入力の長さです。Stride が 1 の場合、出力のサイズは入力と同じになります。
"causal" — 入力の左にパディングを適用します。これは (FilterSize - 1) .* DilationFactor と同じです。Stride が 1 の場合、出力のサイズは入力と同じになります。
非負の整数 sz — サイズ sz のパディングを入力の両側に追加します。
非負の整数のベクトル [l r] — サイズが l のパディングを入力の左に追加し、サイズが r のパディングを入力の右に追加します。

例: Padding=[2 1] は、サイズが 2 のパディングを入力の左に追加し、サイズが 1 のパディングを入力の右に追加します。

プロパティ

すべて展開する

畳み込み

`FilterSize` — フィルターの幅
正の整数

このプロパティは読み取り専用です。

フィルターの幅。正の整数として指定します。

`NumFilters` — フィルターの数
正の整数

このプロパティは読み取り専用です。

フィルターの数。正の整数として指定します。この数値は、入力の同じ領域に結合する層のニューロンの数に対応します。このパラメーターは、層の出力のチャネル (特徴マップ) の数を決定します。

`Stride` — 入力を走査するステップサイズ
`1` (既定値) | 正の整数

入力を走査するステップサイズ。正の整数として指定します。

`DilationFactor` — 膨張畳み込みの係数
`1` (既定値) | 正の整数

膨張畳み込み (Atrous 畳み込みとも呼ばれる) の係数。正の整数として指定します。

膨張畳み込みを使用して、パラメーターの数や計算量を増やさずに、層の受容野 (層で確認できる入力の領域) を増やすことができます。

各フィルター要素間にゼロを挿入すると、層のフィルターが拡張されます。膨張係数は、入力のサンプリングのステップサイズ、またはこれと等価であるフィルターのアップサンプリング係数を決定します。これは、有効なフィルターサイズ (FilterSize – 1) .* DilationFactor + 1 に相当します。たとえば、膨張係数 2 の 1 行 3 列のフィルターは、要素間にゼロが挿入された 1 行 5 列のフィルターと等価です。

`PaddingSize` — パディングのサイズ
`[0 0]` (既定値) | 2 つの非負の整数のベクトル

入力の各側面に適用するパディングのサイズ。2 つの非負の整数のベクトル [l r] として指定します。l は左に適用されるパディング、r は右に適用されるパディングです。

層の作成時に、名前と値の引数 Padding を使用してパディングのサイズを指定します。

データ型: double

`PaddingMode` — パディングのサイズを決定するメソッド
`'manual'` (既定値) | `'same'` | `'causal'`

このプロパティは読み取り専用です。

パディングのサイズを決定する方法。次のいずれかとして指定します。

'manual' – Padding で指定された整数またはベクトルを使用してパディングします。
'same' – 出力のサイズが ceil(inputSize/Stride) となるようにパディングを適用します。ここで、inputSize は入力の長さです。Stride が 1 の場合、出力は入力と同じになります。
'causal' – 因果的パディングを適用します。パディングサイズ (FilterSize - 1) .* DilationFactor を使用して入力の左にパディングします。

層のパディングを指定するには、名前と値の引数 Padding を使用します。

データ型: char

`PaddingValue` — パディングするデータの値
`0` (既定値) | スカラー | `'symmetric-include-edge'` | `'symmetric-exclude-edge'` | `'replicate'`

このプロパティは読み取り専用です。

パディングするデータの値。次のいずれかとして指定します。

`PaddingValue`	説明	例
スカラー	指定したスカラー値でパディングします。	$[\begin{matrix} 3 & 1 & 4 \end{matrix}] \to [\begin{matrix} 0 & 0 & 3 & 1 & 4 & 0 & 0 \end{matrix}]$
`'symmetric-include-edge'`	入力のミラーリングされた値を使用して、エッジの値を含めてパディングします。	$[\begin{matrix} 3 & 1 & 3 \end{matrix}] \to [\begin{matrix} 1 & 3 & 3 & 1 & 4 & 4 & 1 \end{matrix}]$
`'symmetric-exclude-edge'`	入力のミラーリングされた値を使用して、エッジの値を除外してパディングします。	$[\begin{matrix} 3 & 1 & 4 \end{matrix}] \to [\begin{matrix} 4 & 1 & 3 & 1 & 4 & 1 & 3 \end{matrix}]$
`'replicate'`	入力の繰り返し境界要素を使用してパディングします。	$[\begin{matrix} 3 & 1 & 3 \end{matrix}] \to [\begin{matrix} 3 & 3 & 3 & 1 & 4 & 4 & 4 \end{matrix}]$

`NumChannels` — 入力チャネル数
`'auto'` (既定値) | 正の整数

このプロパティは読み取り専用です。

入力チャネル数。次のいずれかとして指定します。

'auto' — 学習時に入力チャネルの数を自動的に決定します。
正の整数 — 指定された数の入力チャネルの層を構成します。NumChannels と層入力データのチャネル数は一致しなければなりません。たとえば、入力が RGB イメージの場合、NumChannels は 3 でなければなりません。入力が 16 個のフィルターをもつ畳み込み層の出力である場合、NumChannels は 16 でなければなりません。

パラメーターと初期化

`WeightsInitializer` — 重みを初期化する関数
`'glorot'` (既定値) | `'he'` | `'narrow-normal'` | `'zeros'` | `'ones'` | 関数ハンドル

重みを初期化する関数。次のいずれかに指定します。

'glorot' — Glorot 初期化子[1](Xavier 初期化子とも呼ばれる) を使用して重みを初期化します。Glorot 初期化子は、平均 0、分散 2/(numIn + numOut) の一様分布から個別にサンプリングを行います。ここで、numIn = FilterSize*NumChannels および numOut = FilterSize*NumFilters です。
'he' – He 初期化子[2]を使用して重みを初期化します。He 初期化子は、平均 0、分散 2/numIn の正規分布からサンプリングを行います。ここで、numIn = FilterSize*NumChannels です。
'narrow-normal' — 平均 0、標準偏差 0.01 の正規分布から個別にサンプリングを行って、重みを初期化します。
'zeros' — 0 で重みを初期化します。
'ones' — 1 で重みを初期化します。
関数ハンドル — カスタム関数で重みを初期化します。関数ハンドルを指定する場合、関数は weights = func(sz) という形式でなければなりません。ここで、sz は重みのサイズです。例については、カスタム重み初期化関数の指定を参照してください。

この層では、Weights プロパティが空の場合にのみ重みが初期化されます。

データ型: char | string | function_handle

`BiasInitializer` — バイアスを初期化する関数
`"zeros"` (既定値) | `"narrow-normal"` | `"ones"` | 関数ハンドル

バイアスを初期化する関数。次のいずれかの値として指定します。

"zeros" — 0 でバイアスを初期化します。
"ones" — 1 でバイアスを初期化します。
"narrow-normal" — 平均 0、標準偏差 0.01 の正規分布から個別にサンプリングを行って、バイアスを初期化します。
関数ハンドル — カスタム関数でバイアスを初期化します。関数ハンドルを指定する場合、関数は bias = func(sz) という形式でなければなりません。ここで、sz はバイアスのサイズです。

この層では、Bias プロパティが空の場合にのみバイアスが初期化されます。

データ型: char | string | function_handle

`Weights` — 層の重み
`[]` (既定値) | 数値配列

転置畳み込み演算で使用する層の重み。FilterSize×NumChannels×numFilters の数値配列、または [] として指定します。

層の重みは学習可能なパラメーターです。層の Weights プロパティを使用して、重みの初期値を直接指定できます。ネットワークに学習させるときに、層の Weights プロパティが空ではない場合、関数 trainnet および trainNetwork は Weights プロパティを初期値として使用します。Weights プロパティが空の場合、ソフトウェアは層の WeightsInitializer プロパティによって指定された初期化子を使用します。

データ型: single | double

`Bias` — 層のバイアス
`[]` (既定値) | 数値配列

転置畳み込み演算で使用する層のバイアス。1 行 NumFilters 列の数値配列、または [] として指定します。

層のバイアスは学習可能なパラメーターです。ニューラルネットワークの学習時に、Bias が空ではない場合、関数 trainnet および trainNetwork は Bias プロパティを初期値として使用します。Bias が空の場合、ソフトウェアは BiasInitializer によって指定された初期化子を使用します。

データ型: single | double

学習率および正則化

`WeightLearnRateFactor` — 重みの学習率係数
`1` (既定値) | 非負のスカラー

重みの学習率係数。非負のスカラーとして指定します。

この係数にグローバル学習率が乗算されて、この層の重みの学習率が決定されます。たとえば、WeightLearnRateFactor が 2 の場合、この層の重みの学習率は現在のグローバル学習率の 2 倍になります。関数 trainingOptions で指定した設定に基づいて、グローバル学習率が決定されます。

`BiasLearnRateFactor` — バイアスの学習率係数
`1` (既定値) | 非負のスカラー

バイアスの学習率係数。非負のスカラーとして指定します。

この係数にグローバル学習率が乗算されて、この層のバイアスの学習率が決定されます。たとえば、BiasLearnRateFactor が 2 の場合、層のバイアスの学習率は現在のグローバル学習率の 2 倍になります。関数 trainingOptions で指定した設定に基づいて、グローバル学習率が決定されます。

`WeightL2Factor` — 重みの L₂ 正則化係数
1 (既定値) | 非負のスカラー

重みの L₂ 正則化係数。非負のスカラーとして指定します。

この係数にグローバル L₂ 正則化係数が乗算されて、この層の重みの L₂ 正則化が決定されます。たとえば、WeightL2Factor が 2 の場合、この層の重みの L₂ 正則化はグローバル L₂ 正則化係数の 2 倍になります。グローバル L₂ 正則化係数は、関数 trainingOptions を使用して指定できます。

`BiasL2Factor` — バイアスの L₂ 正則化係数
`0` (既定値) | 非負のスカラー

バイアスの L₂ 正則化係数。非負のスカラーとして指定します。

この係数にグローバル L₂ 正則化係数が乗算されて、この層のバイアスの L₂ 正則化が決定されます。たとえば、BiasL2Factor が 2 の場合、この層のバイアスの L₂ 正則化はグローバル L₂ 正則化係数の 2 倍になります。関数 trainingOptions で指定した設定に基づいて、グローバル L₂ 正則化係数が決定されます。

層

`Name` — 層の名前
`""` (既定値) | 文字ベクトル | string スカラー

層の名前。文字ベクトルまたは string スカラーとして指定します。Layer 配列入力の場合、関数 trainnet、trainNetwork、assembleNetwork、layerGraph、および dlnetwork は、名前が "" の層に自動的に名前を割り当てます。

Convolution1DLayer オブジェクトは、このプロパティを文字ベクトルとして格納します。

データ型: char | string

`NumInputs` — 入力の数
`1` (既定値)

このプロパティは読み取り専用です。

層への入力の数。1 として返されます。この層は単一の入力のみを受け入れます。

データ型: double

`InputNames` — 入力名
`{'in'}` (既定値)

このプロパティは読み取り専用です。

入力名。{'in'} として返されます。この層は単一の入力のみを受け入れます。

データ型: cell

`NumOutputs` — 出力の数
`1` (既定値)

このプロパティは読み取り専用です。

層からの出力の数。1 として返されます。この層には単一の出力のみがあります。

データ型: double

`OutputNames` — 出力名
`{'out'}` (既定値)

このプロパティは読み取り専用です。

出力名。{'out'} として返されます。この層には単一の出力のみがあります。

データ型: cell

例

すべて折りたたむ

1 次元畳み込み層の作成

ライブスクリプトを開く

幅が 11 である 96 個のフィルターをもつ 1 次元畳み込み層を作成します。

layer = convolution1dLayer(11,96)

layer = 
  Convolution1DLayer with properties:

              Name: ''

   Hyperparameters
        FilterSize: 11
       NumChannels: 'auto'
        NumFilters: 96
            Stride: 1
    DilationFactor: 1
       PaddingMode: 'manual'
       PaddingSize: [0 0]
      PaddingValue: 0

   Learnable Parameters
           Weights: []
              Bias: []

Use properties method to see a list of all properties.

Layer 配列に 1 次元畳み込み層を含めます。

layers = [
    sequenceInputLayer(3,MinLength=20)
    convolution1dLayer(11,96)
    reluLayer
    globalMaxPooling1dLayer
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer]

layers = 
  7x1 Layer array with layers:

     1   ''   Sequence Input           Sequence input with 3 dimensions
     2   ''   1-D Convolution          96 11 convolutions with stride 1 and padding [0  0]
     3   ''   ReLU                     ReLU
     4   ''   1-D Global Max Pooling   1-D global max pooling
     5   ''   Fully Connected          10 fully connected layer
     6   ''   Softmax                  softmax
     7   ''   Classification Output    crossentropyex

アルゴリズム

すべて展開する

1 次元畳み込み層

層が畳み込みを行う次元は、層の入力によって次のように異なります。

時系列とベクトルシーケンスの入力 (チャネル、観測値、およびタイムステップに対応する 3 次元のデータ) の場合、層は時間次元で畳み込みます。
1 次元イメージ入力 (空間ピクセル、チャネル、および観測値に対応する 3 次元のデータ) の場合、層は空間次元で畳み込みます。
1 次元シーケンス入力 (空間ピクセル、チャネル、観測値、およびタイムステップに対応する 4 次元のデータ) の場合、層は空間次元で畳み込みます。

層の入力形式と出力形式

層配列内または層グラフ内の層は、書式化された dlarray オブジェクトとして後続の層にデータを渡します。dlarray オブジェクトの形式は文字列で、各文字はデータ内の対応する次元を表します。この形式には次の文字が 1 つ以上含まれています。

"S" — 空間
"C" — チャネル
"B" — バッチ
"T" — 時間
"U" — 指定なし

たとえば、ベクトルシーケンスデータを、最初の次元がチャネル次元に対応し、2 番目の次元がバッチ次元に対応し、3 番目の次元が時間次元に対応する 3 次元の配列として表すことができます。この表現は、"CBT" (channel、batch、time) の形式になります。

functionLayer オブジェクトを使用するか、関数 forward と関数 predict を dlnetwork オブジェクトと共に使用して、カスタム層の開発などの自動微分ワークフローで、これらの dlarray オブジェクトを操作できます。

次の表は、Convolution1DLayer オブジェクトでサポートされている入力形式、および対応する出力形式を示しています。ソフトウェアが nnet.layer.Formattable クラスを継承していないカスタム層、または Formattable プロパティが 0 (false) に設定された FunctionLayer オブジェクトに層の出力を渡す場合、その層は書式化されていない dlarray オブジェクトを受け取り、この表に示された形式に従って次元が並べられます。ここには一部の形式のみを示します。層では、追加の "S" (空間) 次元または "U" (未指定) 次元をもつ形式など、追加の形式がサポートされている場合があります。

入力形式	出力形式
`"SCB"` (spatial、channel、batch)	`"SCB"` (spatial、channel、batch)
`"CBT"` (channel、batch、time)	`"CBT"` (channel、batch、time)
`"SCBT"` (spatial、channel、batch、time)	`"SCBT"` (spatial、channel、batch、time)

dlnetwork オブジェクトでは、Convolution1DLayer オブジェクトもこれらの入力形式と出力形式の組み合わせをサポートします。

入力形式	出力形式
`"SC"` (spatial、channel)	`"SC"` (spatial、channel)
`"CT"` (channel、time)	`"CT"` (channel、time)
`"SCT"` (spatial、channel、time)	`"SCT"` (spatial、channel、time)

参照

[1] Glorot, Xavier, and Yoshua Bengio. "Understanding the Difficulty of Training Deep Feedforward Neural Networks." In Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics, 249–356. Sardinia, Italy: AISTATS, 2010. https://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf

[2] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. "Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification." In 2015 IEEE International Conference on Computer Vision (ICCV), 1026–34. Santiago, Chile: IEEE, 2015. https://doi.org/10.1109/ICCV.2015.123

バージョン履歴

R2021b で導入

convolution1dLayer

説明

作成

構文

説明

入力引数

Padding — 入力に適用するパディング [0 0] (既定値) | "same" | "causal" | 非負の整数 | 非負の整数のベクトル

プロパティ

畳み込み

FilterSize — フィルターの幅 正の整数

NumFilters — フィルターの数 正の整数

Stride — 入力を走査するステップ サイズ 1 (既定値) | 正の整数

DilationFactor — 膨張畳み込みの係数 1 (既定値) | 正の整数

PaddingSize — パディングのサイズ [0 0] (既定値) | 2 つの非負の整数のベクトル

PaddingMode — パディングのサイズを決定するメソッド 'manual' (既定値) | 'same' | 'causal'

PaddingValue — パディングするデータの値 0 (既定値) | スカラー | 'symmetric-include-edge' | 'symmetric-exclude-edge' | 'replicate'

NumChannels — 入力チャネル数 'auto' (既定値) | 正の整数

パラメーターと初期化

WeightsInitializer — 重みを初期化する関数 'glorot' (既定値) | 'he' | 'narrow-normal' | 'zeros' | 'ones' | 関数ハンドル

BiasInitializer — バイアスを初期化する関数 "zeros" (既定値) | "narrow-normal" | "ones" | 関数ハンドル

Weights — 層の重み [] (既定値) | 数値配列

Bias — 層のバイアス [] (既定値) | 数値配列

学習率および正則化

WeightLearnRateFactor — 重みの学習率係数 1 (既定値) | 非負のスカラー

BiasLearnRateFactor — バイアスの学習率係数 1 (既定値) | 非負のスカラー

WeightL2Factor — 重みの L2 正則化係数 1 (既定値) | 非負のスカラー

BiasL2Factor — バイアスの L2 正則化係数 0 (既定値) | 非負のスカラー

層

Name — 層の名前 "" (既定値) | 文字ベクトル | string スカラー

NumInputs — 入力の数 1 (既定値)

InputNames — 入力名 {'in'} (既定値)

NumOutputs — 出力の数 1 (既定値)

OutputNames — 出力名 {'out'} (既定値)

例

1 次元畳み込み層の作成

アルゴリズム

1 次元畳み込み層

層の入力形式と出力形式

参照

バージョン履歴

参考

トピック

`Padding` — 入力に適用するパディング
`[0 0]` (既定値) | `"same"` | `"causal"` | 非負の整数 | 非負の整数のベクトル

`FilterSize` — フィルターの幅
正の整数

`NumFilters` — フィルターの数
正の整数

`Stride` — 入力を走査するステップサイズ
`1` (既定値) | 正の整数

`DilationFactor` — 膨張畳み込みの係数
`1` (既定値) | 正の整数

`PaddingSize` — パディングのサイズ
`[0 0]` (既定値) | 2 つの非負の整数のベクトル

`PaddingMode` — パディングのサイズを決定するメソッド
`'manual'` (既定値) | `'same'` | `'causal'`

`PaddingValue` — パディングするデータの値
`0` (既定値) | スカラー | `'symmetric-include-edge'` | `'symmetric-exclude-edge'` | `'replicate'`

`NumChannels` — 入力チャネル数
`'auto'` (既定値) | 正の整数

`WeightsInitializer` — 重みを初期化する関数
`'glorot'` (既定値) | `'he'` | `'narrow-normal'` | `'zeros'` | `'ones'` | 関数ハンドル

`BiasInitializer` — バイアスを初期化する関数
`"zeros"` (既定値) | `"narrow-normal"` | `"ones"` | 関数ハンドル

`Weights` — 層の重み
`[]` (既定値) | 数値配列

`Bias` — 層のバイアス
`[]` (既定値) | 数値配列

`WeightLearnRateFactor` — 重みの学習率係数
`1` (既定値) | 非負のスカラー

`BiasLearnRateFactor` — バイアスの学習率係数
`1` (既定値) | 非負のスカラー

`WeightL2Factor` — 重みの L₂ 正則化係数
1 (既定値) | 非負のスカラー

`BiasL2Factor` — バイアスの L₂ 正則化係数
`0` (既定値) | 非負のスカラー

`Name` — 層の名前
`""` (既定値) | 文字ベクトル | string スカラー

`NumInputs` — 入力の数
`1` (既定値)

`InputNames` — 入力名
`{'in'}` (既定値)

`NumOutputs` — 出力の数
`1` (既定値)

`OutputNames` — 出力名
`{'out'}` (既定値)