热线电话:13121318867

登录
2019-01-11 阅读量: 974
one-hot 编码 和哑变量的区别?


one-hot编码:

如果一个数据集的特征是分类变量,如:{小学,初中,高中,大学}。

这时候可以使用one-hot编码,将拥有的状态就是1,未拥有的状态就是0。有几个状态就有几位数。

例如:数据集 :

小明:小学 1000

小红:初中 0100

小兰:大学 0001

小张:高中 0010


哑变量:

上述的数据集,如若变成哑变量的形式,可以将其中的小学变为 0000

所以:

小明:小学 0000

小红:初中 0100

小兰:大学 0001

小张:高中 0010

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子