2019-06-05
阅读量:
640
python变量
类别变量转化为数字,需要区分是否是有序类别,如 male和female,就是无序的,应该转化成(1,0)和(0,1),但衣服大小,M,L,XL,则应转化为1,2,3
若将无序属性连续化,则会不恰当的引入序关系,对后续处理如距离计算等造成误导
二、类别变量转化的Python实现
1、有序的类别变量
有序的类别变量转化,一般直接采用赋值、映射的方法即可,可以采用Python带的map函数。
比如size:[X,XL,XXL],使用数值的映射{X:1,XL:2,XXL:3}。
2、无序的类别变量
无序的类别变量转化,一般对应的转码方式为 one-hot编码,采用pd.get_dummies(df) 就可以。






评论(0)


暂无数据