登录
首页精彩阅读数据挖掘中的经典算法都有哪些(三)
数据挖掘中的经典算法都有哪些(三)
2019-01-21
收藏


在上一篇文章中我们给大家介绍了很多数据挖掘算法,这些算法在数据挖掘工作中起到了十分重要的作用,掌握了这些算法我们才能够顺利的进行数据挖掘工作,所以我们今天再这篇文章就给大家介绍剩余的集中数据挖掘的经典算法,希望能够给大家带来帮助。


首先我们给大家介绍一下kNN算法,这种算法的全名称叫做k-nearest neighbor classification,也就是K最近邻,简称为KNN算法,这种分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似,即特征空间中最邻近的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法常用于数据挖掘中的分类,起到了至关重要的作用。


然后我们给大家介绍一下Naive Bayes算法,在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的性能最为良好。这种算法在数据挖掘工作使用率还是挺高的,一名优秀的数据挖掘师一定懂得使用这一种算法。


最后我们给大家说一下CART算法,CART, 也就是Classification and Regression Trees。就是我们常见的分类与回归树,在分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。这两个思想也就决定了这种算法的地位。


我们在这篇文章中给大家介绍了三种经典的数据挖掘算法,加上前面两篇文章中介绍的七种算法,我们一共给大家介绍了数据挖掘中经典的十个算法,如果要从事数据挖掘行业一定不能忽略这些算法的学习。最后希望大家都学有所成,学以致用,重新开创人生的新世界。

数据分析咨询请扫描二维码

客服在线
立即咨询