深層学習を使用した sequence-to-sequence 分類

この例では、長短期記憶 (LSTM) ネットワークを使用してシーケンスデータの各タイムステップを分類する方法を説明します。

シーケンスデータの各タイムステップを分類するよう深層ニューラルネットワークに学習させるために、"sequence-to-sequence LSTM ネットワーク" を使用できます。sequence-to-sequence LSTM ネットワークでは、シーケンスデータの個々のタイムステップで異なる予測を行うことができます。

この例では、体に装着したスマートフォンから得られたセンサーデータを使用します。この例では、3 つの異なる方向での加速度計の読み取り値を表す時系列データから、装着者の行動を認識するように LSTM ネットワークに学習させます。

シーケンスデータの読み込み

行動認識データを読み込みます。学習データには 6 人の人物の時系列データが含まれています。テストデータには、7 番目の人物の 1 つの時系列が含まれています。各シーケンスには 3 つの特徴があり、長さはさまざまです。3 つの特徴は、3 つの異なる方向での加速度計の測定値に対応します。

load HumanActivityTrain
XTrain

XTrain=6×1 cell array
    {3×64480 double}
    {3×53696 double}
    {3×56416 double}
    {3×50688 double}
    {3×51888 double}
    {3×54256 double}

1 つの学習シーケンスをプロットで可視化します。最初の学習シーケンスの最初の特徴をプロットし、対応する行動に応じてプロットに色を付けます。

X = XTrain{1}(1,:);
classes = categories(YTrain{1});

figure
for j = 1:numel(classes)
    label = classes(j);
    idx = find(YTrain{1} == label);
    hold on
    plot(idx,X(idx))
end
hold off

xlabel("Time Step")
ylabel("Acceleration")
title("Training Sequence 1, Feature 1")
legend(classes,'Location','northwest')

LSTM ネットワークアーキテクチャの定義

LSTM ネットワークアーキテクチャを定義します。入力をサイズ 3 (入力データの特徴の数) のシーケンスになるように指定します。200 個の隠れユニットを持つ LSTM 層を指定して、シーケンス全体を出力します。最後に、サイズが 5 の全結合層を含めることによって 5 個のクラスを指定し、その後にソフトマックス層と分類層を配置します。

numFeatures = 3;
numHiddenUnits = 200;
numClasses = 5;

layers = [ ...
    sequenceInputLayer(numFeatures)
    lstmLayer(numHiddenUnits,'OutputMode','sequence')
    fullyConnectedLayer(numClasses)
    softmaxLayer
    classificationLayer];

学習オプションを指定します。ソルバーを 'adam' に設定します。学習を 60 エポック行います。勾配の発散を防ぐために、勾配しきい値を 2 に設定します。

options = trainingOptions('adam', ...
    'MaxEpochs',60, ...
    'GradientThreshold',2, ...
    'Verbose',0, ...
    'Plots','training-progress');

trainNetwork を使用し、指定した学習オプションで LSTM ネットワークに学習させます。各ミニバッチには学習セット全体が含まれているので、プロットはエポックごとに更新されます。シーケンスが非常に長いため、各ミニバッチの処理とプロットの更新に時間がかかる場合があります。

net = trainNetwork(XTrain,YTrain,layers,options);

LSTM ネットワークのテスト

テストデータを読み込み、タイムステップごとに行動を分類します。

行動のテストデータを読み込みます。XTest には 3 次元の単一シーケンスが含まれます。YTest には、各タイムステップでの行動に対応するカテゴリカルラベルのシーケンスが含まれます。

load HumanActivityTest
figure
plot(XTest{1}')
xlabel("Time Step")
legend("Feature " + (1:numFeatures))
title("Test Data")

classify を使用してテストデータを分類します。

YPred = classify(net,XTest{1});

または、classifyAndUpdateState を使用して 1 タイムステップずつ予測できます。これは、タイムステップの値がストリームで到着する場合に役立ちます。通常、1 タイムステップずつ予測するよりも、シーケンス全体について予測する方が高速です。1 つのタイムステップでの予測間にネットワークを更新して将来のタイムステップを予測する方法を示す例については、深層学習を使用した時系列予測を参照してください。

予測の精度を計算します。

acc = sum(YPred == YTest{1})./numel(YTest{1})

acc = 0.9998

プロットを使用して予測をテストデータと比較します。

figure
plot(YPred,'.-')
hold on
plot(YTest{1})
hold off

xlabel("Time Step")
ylabel("Activity")
title("Predicted Activities")
legend(["Predicted" "Test Data"])

参考

trainnet | trainingOptions | dlnetwork | lstmLayer | sequenceInputLayer

深層学習を使用した sequence-to-sequence 分類

シーケンス データの読み込み

LSTM ネットワーク アーキテクチャの定義

LSTM ネットワークのテスト

参考

トピック

シーケンスデータの読み込み

LSTM ネットワークアーキテクチャの定義