热线电话:13121318867

登录
2019-06-05 阅读量: 640
python变量

类别变量转化为数字,需要区分是否是有序类别,如 male和female,就是无序的,应该转化成(1,0)和(0,1),但衣服大小,M,L,XL,则应转化为1,2,3

若将无序属性连续化,则会不恰当的引入序关系,对后续处理如距离计算等造成误导

二、类别变量转化的Python实现

1、有序的类别变量

有序的类别变量转化,一般直接采用赋值、映射的方法即可,可以采用Python带的map函数。

比如size:[X,XL,XXL],使用数值的映射{X:1,XL:2,XXL:3}。

2、无序的类别变量

无序的类别变量转化,一般对应的转码方式为 one-hot编码,采用pd.get_dummies(df) 就可以。

85.7143
4
关注作者
收藏
评论(0)

发表评论

暂无数据