热线电话:13121318867

登录
2020-11-04 阅读量: 751
聚类分析如何选择相似性度量

问:

在做聚类分析时,发现用余弦相似度和皮尔逊相关系数作为相似性度量,所得到聚类结果有一定差异。请问这两者有什么区别呢?



答:

在做聚类分析时,可参考以下标准选择相似度的度量:


1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就用欧几里德算法


2.数据受级别膨胀影响(不同的用户使用不同的评分标准),就用皮尔逊相关系数算法


3.数据稀疏性强,就考虑用夹角余弦相似度算法


26.0724
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子