机器学习—局部加权线性回归-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读机器学习—局部加权线性回归

机器学习—局部加权线性回归

2018-06-01

机器学习—局部加权线性回归

机器学习—局部加权线性回归

介绍之前先提稍微一下线性回归，用最小二乘法等方法，拟合出最适合训练集的一条直线。

我们得到了最小二乘的损失函数为，通过求得损失函数的极小值来求得参数。

局部加权线性回归的进行前提必须要有预测值x才可以进行，它的原理是损失函数变为

的表达式如下：

这里的x就是预测值，所以必须要有预测值才可以求出损失函数，通过求损失函数的极小值来得到参数。与X的分布于正态分布类似，但和正态分布没有一毛钱关系。

图就不画了，说一下当预测值和训练集很接近时，权值为1；当相隔很远时，权值为0

Γ的值提前也要设置好，这个代表着W(i)上升和下降的速率。

最后通过求得J(Θ)的极小值就可以得到Θ向量。

缺点很明显了，你想要预测一个值就要求一组Θ向量，当你要预测很多值（数据集很大）时，或者甚至你要预测几乎所有连续的X想得到一条拟合曲线时（微积分一段段线性回归的组合），这TM成本太高，计算太慢了，所以在看清数据集大小的情况下慎重选择算法模型。

PS.通俗一点讲就是利用接近预测值x的训练集点来拟合一条直线，某种意义讲你可以把它想象原来庞大的训练集分割成只有接近x的数据集来进行线性回归，但是这个和真正的局部加权线性回归不一样！记住了。

以下红色为局部线性回归模型，蓝色就是线线性回归，可以看到预测值在红色时比较精确。

当然可以想想看，如果拟合一条二次的曲线（即非线性），在图中的黄色曲线预测效果也是不错的。当然你可以选择1次，2次.....这样的模型去试，看看效果。如果你不想这么做，就可以选择局部线性回归。

额，有时间在上一python代码吧。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

线性回归损失函数正态分布最小二乘机器学习 python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇R读取spss的sav格式数据

下一篇将python代码和注释分离的方法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

机器学习—局部加权线性回归

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】神经网络最后一层：激活函数加还是不加 ...

【CDA干货】特征相对重要性：解锁模型鲁棒性与可解 ...

CDA数据分析师：指标体系搭建方法论，让数据驱动精 ...

【CDA干货】回归分析中调整后R方为负？本质、成因与 ...

【CDA干货】经纬度热力图：从离散坐标到空间密度的 ...

CDA数据分析师：用通用与场景指标，构建业务洞察双 ...

【CDA干货】季节分解法：解锁时间序列数据的“四季 ...

【CDA干货】大数据存储技术全景解析：从架构到选型 ...

CDA数据分析师：以指标为钥，解锁数据与业务的连接 ...

【CDA干货】神经网络损失函数：没有“最佳值”，但 ...

CDA数据分析师：用参数估计，让样本数据说出总体真 ...

【CDA干货】数据标准化后出现负值？别急！场景化解 ...

【CDA干货】数据驱动增长：三大行业A/B测试落地案例 ...

【CDA干货】解密LSTM预测结果：为何有时相同，有时 ...

描述性统计：CDA数据分析师的“数据透视镜” ...

【CDA干货】从杂乱到清晰：无序数据点的系统分析方 ...

【CDA干货】MySQL查询阻塞在query end状态：排查与 ...

CDA数据分析师：用透视分析方法，让表结构数据秒变 ...

【CDA干货】分布的“性格”：正态与偏态如何左右统 ...

【CDA干货】一次查500条vs5次查100条：数据查询的压 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载