Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

時系列分散型遅延ニューラル ネットワークの設計

FTDNN には、静的フィードフォワード ネットワークの最初の層への入力にのみタップ付き遅延線記憶がありました。タップ付き遅延線をネットワーク全体に分散させることもできます。分散型 TDNN は、音素認識用に [WaHa89] で初めて導入されました。元のアーキテクチャは、その特定の問題に非常に特化されていました。次の図は一般的な 2 層分散型 TDNN を示しています。

このネットワークは、音素認識と似た簡略化された問題に使用できます。このネットワークは、入力信号の周波数成分の認識を試みます。次の図は、任意の時点で 2 つの周波数のうち 1 つが存在する信号を示しています。

次のコードは、この信号およびターゲット ネットワーク出力を作成します。ターゲット出力は、入力が低周波数の場合に 1 で、入力が高周波数の場合に -1 です。

次に、関数 distdelaynet を使用して、分散型 TDNN ネットワークを作成します。関数 distdelaynet と関数 timedelaynet の唯一の違いは、最初の入力引数が、各層で使用されるタップ付き遅延を含む cell 配列であるかどうかです。次の例では、層 1 で 0 ~ 4 の遅延、層 2 で 0 ~ 3 の遅延を使用します (変化をもたせるために、この例では学習関数として既定の trainlm ではなく trainbr を使用します。浅層の多層ニューラル ネットワークと逆伝播学習で説明されている任意の学習関数を使用することができます)。

このネットワークは 2 つの "音素" を正確に区別できます。

分散型 TDNN ネットワークの学習は、FTDNN の場合よりも一般的に遅くなることがわかります。これは、分散型 TDNN では、動的な逆伝播を使用しなければならないためです。