2020-06-04
阅读量:
971
Python机器学习之独热编码(三)
什么情况下不需要独热编码
1、如果特征是离散的,并且不用独热编码就可以很合理的计算出距离,就没必要进行独热编码。(比如,离散特征共有1000个取值,分成两组是400和600,两个小组之间的距离有合适的定义,组内距离也有合适的定义,就没必要独热编码)
2、有些并不是基于向量空间度量的算法,数值只是个类别符号,没有偏序关系,就不用进行独热编码。
3、如果原本的标签编码是有序的,就不必独热编码了,因为会丢失顺序信息。
16.9449
5
5
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
0条评论

