机器学习中需要了解的概念-CDA数据分析师官网

热线电话：13121318867

机器学习中需要了解的概念

2019-04-26

机器学习有大块的知识，也有零碎的知识，我们在学习机器学习的时候不能忽视这些零碎的知识。如果对这些知识忽视，那么就容易让自己的知识架构残缺不全。如果对这些知识的了解充分，我们就能够更好地理解机器学习。下面我们就为大家介绍机器学习中的基础知识。

（1）广义线性模型就是最小二乘回归模型的推广/泛化，基于高斯噪声，相对于其它类型的模型，这种模型基于其它类型的噪声，比如泊松噪声，或类别噪声等等。广义线性模型的例子包括很多，比如logistic回归、多分类回归、最小二乘回归。而广义线性模型的参数可以通过凸优化得到，它的性质有很多，第一就是最理想的最小二乘回归模型的平均预测结果等于训练数据的平均标签。第二就是最理想的 logistic 回归模型的平均概率的预测结果等于训练数据的平均标签。第三就是广义线性模型的能力局限于其特征的性质。和深度模型不同，一个广义线性模型无法学习新的特征。

（2）启发式就是一个问题的实际的和非最优的解，但能从学习经验中获得足够多的进步。

（3）梯度就是所有变量的偏导数的向量。在机器学习中，梯度是模型函数的偏导数向量。梯度指向最陡峭的上升路线。

（4）梯度截断就是在应用梯度之前先修饰数值，梯度截断有助于确保数值稳定性，防止梯度爆炸出现。

（5）梯度下降是通过计算模型的相关参量和损失函数的梯度最小化损失函数，值取决于训练数据。梯度下降迭代地调整参量，逐渐靠近权重和偏置的最佳组合，从而最小化损失函数。

（6）图在 TensorFlow 中的一种计算过程展示。图中的节点表示操作。节点的连线是有指向性的，表示传递一个操作的结果给另一个操作。使用 TensorBoard 能可视化计算图。

（7）泛化是指模型利用新的没见过的数据而不是用于训练的数据作出正确的预测的能力。

（8）折页损失函数就是损失函数的一个类型，用于分类模型以寻找距离每个样本的距离最大的决策边界，即最大化样本和边界之间的边缘。

在这篇文章中我们给大家介绍了很多有关机器学习的知识，这些知识都是机器学习中深层的概念，所以说大家一定要掌握这些概念，这样就能够更好地掌握机器学习。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；