深層学習のほとんどのネットワークと関数は、入力データの各次元に対して異なる方法で演算を行います。
たとえば、LSTM 演算は入力データの時間次元を反復処理し、バッチ正規化演算は入力データのバッチ次元を正規化します。
ラベルが付いた次元をもつ入力データ、または追加のレイアウト情報をもつ入力データを指定するには、"データ形式" を使用します。
データの形式は文字列で、各文字はデータ内の対応する次元のタイプを表します。
各文字は以下のとおりです。
"S"
— 空間
"C"
— チャネル
"B"
— バッチ
"T"
— 時間
"U"
— 指定なし
たとえば、シーケンスのバッチを含み、1 番目、2 番目、および 3 番目の次元がそれぞれチャネル、観測値、およびタイム ステップに対応する配列の場合、"CBT"
の形式で指定できます。
書式化された入力データを作成するには、dlarray
オブジェクトを作成し、2 番目の引数を使用して形式を指定します。
書式化されていないデータを使用して追加のレイアウト情報を指定するには、引数 FMT
を使用して形式を指定します。
詳細については、Deep Learning Data Formatsを参照してください。