LSTM模型训练精准率高测试精准率很低解决办法_lstm训练集效果不错测试集效果不好

作者：小蓝xlanll | 2024-02-29 19:53:32

踩

lstm训练集效果不错测试集效果不好

前段时间训练一个问答模型（QA）时，发现一个有趣的问题，模型采用LSTM技术，encode-decode架构（见下图）。使用小语料集训练，测试精准率还行，当语料集达到2000组时，问题来了，训练精准率很高，但测试精准率非常低。

小语料集与大语料集测试精准率对比：

测试精准率低的让人有点伤心，训练集增多，除了把batch_size改大，其它没有修改呀，感觉一点思路都没有了，被这个坑卡住了3天，毫无进展。某天，正看着窗外的爬山虎发呆，突然想起培训老师说过，“数据是一批一批训练的，训练完一批数据以后才更新一次梯度”，一批一批训练，这个场景和成语“滥竽充数”很像呀。训练时是一批一批的训练，更新梯度依据的是这一批数据的平均loss值，单条对话的差异给抹平了，但测试一条条对话进行的，就好比南郭先生，整个乐队一起演奏时，谁也不知道他根本不会吹竽。马上把batch_size改为1进行一条一条的训练（随机梯度），发现效果非常好，问题解决。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小蓝xlanll/article/detail/167959

LSTM模型训练精准率高测试精准率很低解决办法_lstm训练集效果不错 测试集效果不好

LSTM模型训练精准率高测试精准率很低解决办法_lstm训练集效果不错测试集效果不好