当前位置:   article > 正文

LSTM matlab实现_matlab lstm

matlab lstm

前期在学习特征分类的时候确实花了不少功夫,想去了解一下长短时记忆网络的分类效果如何。这里主要分享一下LSTM的一些简介和代码。


这个例子展示了如何使用长短时记忆(LSTM)网络对序列数据进行分类。

若要训练深度神经网络对序列数据进行分类,您可以使用LSTM网络。LSTM网络使您能够将序列数据输入到网络中,并根据序列数据的单个时间步长进行预测。

本示例使用了日语元音数据集。这个例子训练一个LSTM网络来识别给定的代表两个连续日语元音的时间序列数据。训练数据包含了9名演讲者的时间序列数据。每个序列有12个特征,并且长度也有所不同。该数据集包含270个训练观察结果和370个测试观察。


Load Sequence Data
加载日语元音训练数据。
XTrain是一个包含270个长度12维序列的单元格阵列。Y是标签“1”,“2”,...,“9”的分类向量,对应于9个扬声者。XTrain中的条目是包含12行(每个特性为一行)和不同数量的列(每个时间步长为一列)的矩阵。
  1. [XTrain,YTrain] = japaneseVowelsTrainData;
  2. XTrain(1:5)

 Visualize the first time series in a plot. Each line corresponds to a feature.

  1. figure
  2. plot(XTrain{1}')
  3. xlabel("Time Step")
  4. title("Training Observation 1")
  5. numFeatures = size(XTrain{1},1);
  6. legend("Feature " + string(1:numFeatures),'Location','northeastoutside')

Prepare Data for Padding

在训练期间,默认情况下,软件会将训练数据分成小批,并填充序列,使它们具有相同的长度。过多的填充物可能会对网络性能产生负面影响。为了防止训练过程添加过多的填充,可以按序列长度对训练数据进行排序,并选择一个小批的大小,以便小批中的序列具有相似的长度。

 Get the sequence lengths for each observation.

  1. numObservations = numel(XTrain);
  2. for i=1:numObservations
  3. sequence = XTrain{i};
  4. sequenceLengths(i) = size(sequence,2);
  5. end
Sort the data by sequence length.
  1. [sequenceLengths,idx] = sort(sequenceLengths);
  2. XTrain = XTrain(idx);
  3. YTrain = YTrain(idx);
View the sorted sequence lengths in a bar chart.
  1. figure
  2. bar(sequenceLengths)
  3. ylim([0 30])
  4. xlabel("Sequence")
  5. ylabel("Length")
  6. title("Sorted Data")

选择一个27的小批量大小,以均匀地划分训练数据,并减少小批量中的填充量。

miniBatchSize = 27;

Define LSTM Network Architecture:

定义LSTM网络架构。将输入大小指定为12大小的序列(输入数据的尺寸)。指定一个包含100个隐藏单元的双向LSTM层,并输出序列的最后一个元素。最后,包含一个大小为9的全连接层,然后是一个softmax层和一个分类层。如果在预测时可以访问完整的序列,那么可以在网络中使用双向LSTM层。双向LSTM层在每个时间步长都从完整序列中学习。如果在预测时无法访问完整的序列,例如,如果正在预测值或一次预测一个时间步长,那么就使用LSTM层来代替。
  1. inputSize = 12;
  2. numHiddenUnits = 100;
  3. numClasses = 9;
  4. layers = [ ...
  5. sequenceInputLayer(inputSize)
  6. bilstmLayer(numHiddenUnits,'OutputMode','last')
  7. fullyConnectedLayer(numClasses)
  8. softmaxLayer
  9. classificationLayer]
layers =
                5×1 Layer array with layers:
                        4 1 '' Sequence Input Sequence input with 12 dimensions
                        2 '' BiLSTM BiLSTM with 100 hidden units
                        3 '' Fully Connected 9 fully connected layer
                        4 '' Softmax softmax
                        5 '' Classification Output crossentropyex

现在,指定培训选项。指定求解器为“adam”,梯度阈值为1,最大周期数为100。要减少小批量的填充量,请选择27。要将数据填充为与最长序列相同的长度,请指定序列长度为“longest”。要确保数据仍然按序列长度排序,请指定永远不要打乱数据。由于小批量处理很小,序列很短,所以训练更适合CPU。请将“ExecutionEnvironment”指定为“cpu”。若要在GPU上进行训练,如果可用,请将“ExecutionEnvironment”设置为“auto”(这是默认值)。

  1. maxEpochs = 100;
  2. miniBatchSize = 27;
  3. options = trainingOptions('adam', ...
  4. 'ExecutionEnvironment','cpu', ...
  5. 'GradientThreshold',1, ...
  6. 'MaxEpochs',maxEpochs, ...
  7. 'MiniBatchSize',miniBatchSize, ...
  8. 'SequenceLength','longest', ...
  9. 'Shuffle','never', ...
  10. 'Verbose',0, ...
  11. 'Plots','training-progress');
Train LSTM Network
使用trainNetwork训练LSTM网络。
net = trainNetwork(XTrain,YTrain,layers,options);
Test LSTM Network
加载测试集,并将序列分类为扬声器。加载日语元音测试数据。
XTest是一个包含370个不同长度为12的序列的单元格阵列。YTest是标签“1”,“2”,...“9”的分类向量,对应于9个扬声器。
  1. [XTest,YTest] = japaneseVowelsTestData;
  2. XTest(1:3)

 LSTM网络网络使用相似长度的小批量序列进行训练。确保测试数据以相同的方式组织。按序列长度对测试数据进行排序。

  1. numObservationsTest = numel(XTest);
  2. for i=1:numObservationsTest
  3. sequence = XTest{i};
  4. sequenceLengthsTest(i) = size(sequence,2);
  5. end
  6. [sequenceLengthsTest,idx] = sort(sequenceLengthsTest);
  7. XTest = XTest(idx);
  8. YTest = YTest(idx);

对测试数据进行分类。为了减少分类过程中引入的填充量,请将小批量大小设置为27。要应用与训练数据相同的填充,请指定序列长度为'longest'

  1. miniBatchSize = 27;
  2. YPred = classify(net,XTest, ...
  3. 'MiniBatchSize',miniBatchSize, ...
  4. 'SequenceLength','longest');

计算预测的分类精度:

acc = sum(YPred == YTest)./numel(YTest)
Copyright 2021.11.25 15:17 The MathWorks, Inc.
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/134801
推荐阅读
相关标签
  

闽ICP备14008679号