2019-01-11
阅读量:
974
one-hot 编码 和哑变量的区别?
one-hot编码:
如果一个数据集的特征是分类变量,如:{小学,初中,高中,大学}。
这时候可以使用one-hot编码,将拥有的状态就是1,未拥有的状态就是0。有几个状态就有几位数。
例如:数据集 :
小明:小学 1000
小红:初中 0100
小兰:大学 0001
小张:高中 0010
哑变量:
上述的数据集,如若变成哑变量的形式,可以将其中的小学变为 0000
所以:
小明:小学 0000
小红:初中 0100
小兰:大学 0001
小张:高中 0010






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论