有福有德

核密度工作原理及实现

SAS的KDE过程实现核密度估计,功能及其说明如下:可以对单变量和双变量进行核密度估计,所谓的核(kernel)估计是一种非参数方法,是指从原始数据中观测到的概率密度函数(PDF)——平均的通过数据点,从而创建平滑曲线。 KDE过程使用高斯密度做为核,并假设其方差决定平滑的结果。 其工作原理:选择带宽(bandwith),进而核密度估计,但完成这些工作前提是完成数据的分箱

214.5274 12 7
  • 关注作者
  • 收藏
有福有德

统计变换技术有感

正好刚刚学了点变换技术,希望同仁能给予批评和交流,共同学习。有些公式不好编辑所以截图分享。Spline与MSpline变换变量缺失部分的变换,Spline、MSpline变换与Linear、Monotone、Opscore、Untie的变换相同。变量非缺失部分的变换,即最优变换(Spline变换),为b-spline基向量的线性组合,而b-spline基可以精确(数量少,没有共线性)、有效

891.3256 9 0
  • 关注作者
  • 收藏
有福有德

共线性及危害

广义上说共线性指的自变量之间的相关性,那么相关性有双变量间的相关,也有多变量间的相关,由此可以进一步区分为共线性和多重共线性。下文首先从共线性的阐述逐步过渡到多重共线性。假设我们需要拟合包含了两个影响因素线性回归,并且假设x_1和x_2的相关系数为r_12, k 表示自变量数。可见参与β ̂计算的是由3部分统计量组成,分子的残差平方和、分母的自变量方差、自变量间的相关性。残差

833.0373 12 0
  • 关注作者
  • 收藏
newbbs

请问数据分析师需要掌握哪些技术?

如题

1174.8675 14 2
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
CDA持证人阿涛哥
480.0000
02
85691082
320.0000