2020-04-07
阅读量:
2314
分类数据进行独热编码是不是就不能用皮尔森相关性检验?
进行独热编码之后数据就会变得得稀疏,对于这样的数据或是数值型的分类数据可以用斯皮尔曼相关
Pearson的条件比Spearman的条件更严格,两者共同条件应该都是
1、两列数据;
2、满足线性假设;
但Pearson要求两列数据均为正态分布,Spearman没有相关要求。
也即,Pearson是Spearman的充分非必要条件。
如果数据不符合Pearson要求,可以把数据降级,然后用Spearman。






推荐帖子
0条评论
0条评论
0条评论