当前位置:   article > 正文

代码问题:划分训练集train_data和测试集test_data

代码问题:划分训练集train_data和测试集test_data

问题:

在有时间关系的预测时,使用sklearn的train_test_split来划分训练集和测试集,会把原有的数据顺序打乱。此时进行数据预测,准确率高达99%,预测结果接近1,趋于完美。因此,对数据集进行重新划分从而进行验证。

原有代码:

  1. from sklearn.model_selection import train_test_split
  2. train_data, test_data, train_target, test_target = train_test_split(df_train, df_targets, test_size=0.8)

将训练集和测试集按照日期进行划分,将前面8个月作为训练集,后面4个月作为测试集,重新进行训练。

  1. train_data = df_train[df_train.month <= 8]
  2. train_target = train_data['meter_reading'# 训练目标
  3. test_data = df_train[df_train.month > 8]
  4. test_target = test_data['meter_reading']

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/430587
推荐阅读
相关标签
  

闽ICP备14008679号