当前位置:   article > 正文

sklearn 中 LabelEncoder transform时 ValueError 错误

labelencoder transform

当使用LableEncoder对数据进行编码时,先fit数据,在transform时如果遇到fit时没有遇过的数据,程序会抛出ValueError异常。
这里相对fit时没遇过的数据统一编码为一个值。

我的解决:

x_train = LabelEncoder_list[i].fit_transform(dfTrain[feat].values) # fit并编号one-hot
try:
    x_test = LabelEncoder_list[i].transform(dfTest[feat].values) # 编号one-hot
except ValueError:
    print("LabelEncoder_list[",i,"] transform out range.")
    x_test = []
    feat_len = len(dfTest[feat].values)
    fit_len = len(LabelEncoder_list[i].classes_)
    for j in range(feat_len):
        if len(np.intersect1d(dfTest[feat].values[j], LabelEncoder_list[i].classes_)) == 1:
        # 看当前value与fit的数据集是否有交集
            x_test.append(np.searchsorted(LabelEncoder_list[i].classes_, dfTest[feat].values[j]))
            # 如果有,把fit的编号返回
        else:
            x_test.append(fit_len + 2)
            # 没有则返回一个fit中没有的编号
            # 编号为 0 - (fit_len - 1)
    x_test = np.array(x_test) # change list to array
    print("fit_len : ", fit_len)
    print("out range x_test : ", x_test)
except:
    print("Error!")
    raise
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23

LabelEncoder.transform() 的源码:
这里写图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/一键难忘520/article/detail/901899
推荐阅读
相关标签
  

闽ICP备14008679号