热线电话:13121318867

登录
2020-06-04 阅读量: 871
Python机器学习之独热编码(三)

什么情况下不需要独热编码
1、如果特征是离散的,并且不用独热编码就可以很合理的计算出距离,就没必要进行独热编码。(比如,离散特征共有1000个取值,分成两组是400和600,两个小组之间的距离有合适的定义,组内距离也有合适的定义,就没必要独热编码)
2、有些并不是基于向量空间度量的算法,数值只是个类别符号,没有偏序关系,就不用进行独热编码。
3、如果原本的标签编码是有序的,就不必独热编码了,因为会丢失顺序信息。

16.9449
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子