登录
首页精彩阅读如何学好数据挖掘(一)
如何学好数据挖掘(一)
2019-02-22
收藏


很多人看到了数据挖掘的前景,就开始学习数据挖掘,但数据挖掘是一个交叉性的学科,需要我们找到一个合适的学习方法才能够做好数据挖掘的学习,在这篇文章中我们就给大家介绍一下数据挖掘的相关知识。


首先,在正式学习之前我们所需要的预备知识(主要是数学)应该包括:微积分(偏导数、梯度等等)、概率论与数理统计(比如极大似然估计、中央极限定理、大数法则等等)、最优化方法(比如梯度下降、牛顿-拉普什方法、变分法(欧拉-拉格朗日方程)、凸优化等等)。如果我们对其中的某些名词感到陌生,那么就说明我们尚不具备深入开展数据挖掘算法学习的能力。你会发现到处都是门槛,很难继续进行下去。所以我们还是要多下功夫进行学习这些知识。


首先我们给大家说一下数据挖掘的学习方法,数据挖掘的学习方法有两种,我们给大家说一下第一种,就是从基于普通最小二乘法简单线性回归开始学习,然后学习线性回归中的新进展(岭回归和LASSO回归),然后学习(此处可以插入Bagging和AdaBoost的内容),然后学习 Logistic回归,然后学习支持向量机SVM),然后学习感知机学习,然后学习神经网络(初学者可先主要关注BP算法),然后进行深度学习


我们把它们归为一条线路,因为所有这些算法都是围绕着数据挖掘展开的,如果你抓住这条线索,不断探索下去,就算是抓住它们之间的线索了。而基于普通最小二乘线性回归是统计中一种有着非常悠久历史的方法,它的使用甚至可以追溯到高斯的时代。但是它对数据有诸多要求,例如特征之间不能有多重共线性,而且岭回归和LASSO就是对这些问题的修正。


如果我们沿着这一条路线学完的时候,其实我们已经攻克机器学习的一半了,当然,在这个过程中,我们一定时刻清楚自己后一个算法与前一个的联系在哪里,只有这样我们才能够学习数据挖掘更加深刻。


从这篇文章中我们给大家介绍了数据挖掘学习的相关内容,想必这些知识能够给大家带来实质性的帮助,我们在进行学习数据挖掘的时候不只是依靠于这些,剩余的内容我们在下一篇文章中继续给大家介绍。

数据分析咨询请扫描二维码

客服在线
立即咨询