热线电话:13121318867

登录
2018-12-10 阅读量: 858
怎么理解欧几里德距离?

我们将使用欧氏距离作为我们数据集的相似度量标准(注意:根据您的项目,您可以使用其他相似性度量标准)。

def EuclideanDistance(x, y):

S = 0; # The sum of the squared differences of the elements

for i in range(len(x)):

S += math.pow(x[i]-y[i], 2);

return math.sqrt(S); #The square root of the sum

要更新均值,我们需要为均值/集群中的所有项找到其特征的平均值。我们可以通过添加所有值然后除以项目数来实现,或者我们可以使用更优雅的解决方案。我们将通过执行以下操作来计算新的平均值,而无需重新添加所有值:

其中m是要素的平均值,n是群集中的项目数,x是添加项目的要素值。我们为每个功能执行上述操作以获得新的平均值

def UpdateMean(n,mean,item):

for i in range(len(mean)):

m = mean[i];

m = (m*(n-1)+item[i])/float(n);

mean[i] = round(m, 3);

return mean;

61.1675
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子