热线电话:13121318867

登录
2020-07-14 阅读量: 963
KNN算法

1.k-NN算法

原理:距离,欧氏距离,近邻思想,少数服从多数,越近越相似

模型:

(1)算距离,欧氏距离(常见)

(2)找邻居

(3)做分类

2.Python代码实现

(1)构建原始数据集(make_blobs)

(2)计算已知类别数据集中的点与当前点之间的距离

(3)将距离升序排列,选取距离最小的k个点

(4)确定前k个点所在的类别的计数

(5)选择次数最多的类别作为当前点的预测类别

3.KNN算法的优缺点

优点:

(1)KNN可以处理分类问题,同时可以处理多分类问题,比如鸢尾花的分类

(2)简单,易懂,同时也很强大,对于手写数字的识别,鸢尾花这一类问题来说,准确率高

(3)KNN还可以处理回归问题,即预测

缺点:

(1)计算效率低,消耗的计算资源较大

(2)对异常值敏感

(3)可重复性弱

(4)需要进行归一化处理

4.增加KNN算法模型的准确度

(1)归一化处理

(2)标准化处理



13.7802
2
关注作者
收藏
评论(0)

发表评论

暂无数据