啊啊啊啊啊吖

2018-12-15   阅读量: 648

数据分析师 机器学习

KNN算法思路

扫码加入数据分析学习群

通过计算每个训练样例到待分类样品的距离,取和待分类样品距离最近的 K 个训练样例, K 个

样品中哪个类别的训练样例占多数,则待分类样品就属于哪个类别

核心思想: 如果一个样本在特征空间中的 k 个最相邻的样本中的大多数属于某一个类别,则该样本

也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或

者几个样本的类别来决定待分样本所属的类别。 kNN 方法在类别决策时,只与极少量的相邻样本

有关。由于 kNN 方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,

因此对于类域的交叉或重叠较多的待分样本集来说, kNN 方法较其他方法更为适合。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子