登录
首页精彩阅读机器学习中涉及到的算法有哪些(中)
机器学习中涉及到的算法有哪些(中)
2019-03-26
收藏


机器学习中有很多算法,比如说线性回归、Logistic 回归、线性判别分析等等,而这些算法我们在上面的文章中给大家介绍了实际情况,在这篇文章中我们会继续为大家介绍一下机器学习算法的相关知识,喜欢人工智能的朋友一定要好好地学起来哟。


首先我们给大家介绍一下决策树的知识,决策树是预测建模机器学习的一种重要算法。决策树模型的表示是一个二叉树。这是算法和数据结构中的二叉树,没什么特别的。每个节点代表一个单独的输入变量x和该变量上的一个分割点。而决策树的叶节点包含一个用于预测的输出变量y。通过遍历该树的分割点,直到到达一个叶节点并输出该节点的类别值就可以作出预测。当然决策树的有点就是决策树学习速度和预测速度都很快。它们还可以解决大量问题,并且不需要对数据做特别准备。


然后我们给大家介绍一下朴素贝叶斯。其实朴素贝叶斯是一个简单但是很强大的预测建模算法。而这个模型由两种概率组成,这两种概率都可以直接从训练数据中计算出来。第一种就是每个类别的概率,第二种就是给定每个 x 的值,每个类别的条件概率。一旦计算出来,概率模型可用于使用贝叶斯定理对新数据进行预测。当我们的数据是实值时,通常假设一个高斯分布,这样我们可以简单的估计这些概率。而朴素贝叶斯之所以是朴素的,是因为它假设每个输入变量是独立的。这是一个强大的假设,真实的数据并非如此,但是,该技术在大量复杂问题上非常有用。所以说,朴素贝叶斯是一个十分实用的功能。


最后我们说一下K近邻算法,K近邻算法简称KNN算法,KNN 算法非常简单且有效。KNN的模型表示是整个训练数据集。KNN算法在整个训练集中搜索K个最相似实例(近邻)并汇总这K个实例的输出变量,以预测新数据点。对于回归问题,这可能是平均输出变量,对于分类问题,这可能是众数类别值。而其中的诀窍在于如何确定数据实例间的相似性。如果属性的度量单位相同,那么最简单的技术是使用欧几里得距离,我们可以根据每个输入变量之间的差值直接计算出来其数值。当然,KNN需要大量内存或空间来存储所有数据,但是只有在需要预测时才执行计算。我们还可以随时更新和管理训练实例,以保持预测的准确性。


在这篇文章中我们给大家介绍了关于机器学习的算法的另一部分内容,其实总的来说机器学习算法都是有自己的特点,这就使得机器学习能够解决更多的问题,希望这篇文章能够更好的帮助大家理解机器学习

数据分析咨询请扫描二维码

客服在线
立即咨询