计算用户之间的相似性为什么要选用余弦相似度？

读童话的狼

2020-03-27 阅读量: 1265

进行用户协同过滤时，一个关键问题是如何计算用户之间的相似性。比较常见的计算用户相似度的算法有余弦相似性、皮尔森系数、调整余弦相似性三种。

这三种相似性都是基于一个称为用户-项目矩阵的数据结构来进行计算的

在数据比较稀疏的情况下，这几种方法均存在一定问题：余弦相似性和调整余弦相似性对于用户未评价项目评分为0的假设；皮尔森系数中用户共同评分项目集可能很小。所以选择哪种方法并没有统一的规则

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子