当前位置:   article > 正文

类别型特征的常见处理方法_类别型特征的编码方式

类别型特征的编码方式

-类别型特征
类别型特征(Categorical Feature)主要是指只在有限选项内取值的特征。例如性别(男、女)、成绩等级(A、B、C)等。通常以字符串形式输入,除了决策树等少数模型能直接处理字符串形式的输入,逻辑回归、支持向量机等模型的输入必须是数值型特征才能正确工作。

-独热编码(One-hot Encoding)
常用于处理特征不同类别间具有大小关系的数据。例如成绩等级(A、B、C),对应成绩越来越好。转换后为(3,2,1),依然保留大小关系;
-序号编码(Ordinal Encoding
常用于处理特征不同类别间不具有大小关系的数据
-二进制编码(Binary Encoding)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/643104
推荐阅读
相关标签
  

闽ICP备14008679号