赞
踩
-类别型特征
类别型特征(Categorical Feature)主要是指只在有限选项内取值的特征。例如性别(男、女)、成绩等级(A、B、C)等。通常以字符串形式输入,除了决策树等少数模型能直接处理字符串形式的输入,逻辑回归、支持向量机等模型的输入必须是数值型特征才能正确工作。
-独热编码(One-hot Encoding)
常用于处理特征不同类别间具有大小关系的数据。例如成绩等级(A、B、C),对应成绩越来越好。转换后为(3,2,1),依然保留大小关系;
-序号编码(Ordinal Encoding
常用于处理特征不同类别间不具有大小关系的数据
-二进制编码(Binary Encoding)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。