2020-07-14
阅读量:
963
KNN算法
1.k-NN算法
原理:距离,欧氏距离,近邻思想,少数服从多数,越近越相似
模型:
(1)算距离,欧氏距离(常见)
(2)找邻居
(3)做分类
2.Python代码实现
(1)构建原始数据集(make_blobs)
(2)计算已知类别数据集中的点与当前点之间的距离
(3)将距离升序排列,选取距离最小的k个点
(4)确定前k个点所在的类别的计数
(5)选择次数最多的类别作为当前点的预测类别
3.KNN算法的优缺点
优点:
(1)KNN可以处理分类问题,同时可以处理多分类问题,比如鸢尾花的分类
(2)简单,易懂,同时也很强大,对于手写数字的识别,鸢尾花这一类问题来说,准确率高
(3)KNN还可以处理回归问题,即预测
缺点:
(1)计算效率低,消耗的计算资源较大
(2)对异常值敏感
(3)可重复性弱
(4)需要进行归一化处理
4.增加KNN算法模型的准确度
(1)归一化处理
(2)标准化处理






评论(0)


暂无数据