【SAS宏】使用WOE和IV实现风险因素筛选 在信用风险评估领域,信用评分卡模型在国内外都是一种非常成熟的预测模型,无论是使用传统的Logistic回归建模乃至一些使用Neural networks算法建模,变量筛选都是整个建 ...
2017-06-01SAS数据集中重复数据的处理方法 在使用SAS在处理数据的时候,经常会遇到或产生一些重复数据,有些重复数据是我们需要的,而有的则是多余的。下面讲到的内容就是筛选/排除某一数据集里重复数据以及去重的几种常 ...
2017-06-01[SAS 测试语法]变数门限回归 今天介绍正在测试中的语法 变数门限回归 首先,创造一个虚拟q, 该虚拟变量唯一个随机数值,我们假设这个变量造成了结构性改变 形成了两种回归式 (是的,我们的回归 ...
2017-06-01sas—日期格式及函数 很久不用sas了,把日期的格式给忘了,重新学习下。 前不久,有个同事问我怎么把 date9.如“21jan2016”d 的格式换成yymmdd10. 2016-01-21的格式; 用informat设定好变量格式即可。 ...
2017-06-01SAS—计算K-S值及画图 近来,时于夜半下雨,也常在梦里被雨扰醒。究其原因,也是因为近来工作无趣,本身也只喜欢写写SAS或Python代码,做模型,可近来却连数据权限都没有,万灰俱灭。雨声轻轻,却也容易愁闷得 ...
2017-06-01【R语言】单一样本推断问题 非参数统计概念: 在实际问题中,对数据的分布形式和统计模型难以作出比较明确的假定,最多只能对总体的分布做出类似于连续性型分布或者对某点对称等一般性假定。这种不假设总体 ...
2017-05-31R语言-组间差异的非参数检验 7.5 组间差异的非参数检验 如果数据无法满足t检验或ANOVA的参数假设,可以转而使用非参数方法。举例来说,若结果变量在本质上就严重偏倚或呈现有序关系,那么你可能会希望使用本节 ...
2017-05-31R语言-回归之简单线性回归 8.1 回归的多面性 回归是一个令人困惑的词,因为它有许多特殊变种(见表8-1)。对于回归模型的拟合, R提供的强大而丰富的功能和选项也同样令人困惑。例如, 2005年Vito Ricc ...
2017-05-31R语言-有交互项的多元线性回归 许多很有趣的研究都会涉及交互项的预测变量。以mtcars数据框中的汽车数据为例,若你对汽车重量和马力感兴趣,可以把它们作为预测变量,并包含交互项来拟合回归模型,参见代码清单 ...
2017-05-31R语言-如何处理违背回归假设的问题 我们已经花费了不少篇幅来学习回归诊断,你可能会问:“如果发现了问题,那么能做些什么呢?”有四种方法可以处理违背回归假设的问题: 删除观测点; 变量变换; 添加或删除 ...
2017-05-31R语言解读多元线性回归模型 在许多生活和工作的实际问题中,影响因变量的因素可能不止一个,比如对于知识水平越高的人,收入水平也越高,这样的一个结论。这其中可能包括了因为更好的家庭条件,所以有了更好的 ...
2017-05-31R语言里面的因子 R语言中的因子确实不好理解,很多人都这么觉得。在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2 ...
2017-05-30R语言自定义函数 R语言某种程度来说本身就是一个函数库,因为它有大量的函数可供调用,加上函数式编程,使得R语言的功能很强大。但是,有时候,根据实际需要,我们还是需要自己动手编写函数,从而减少代码的缀 ...
2017-05-30R语言逻辑运算 R语言包括两个逻辑值:TRUE、FALSE,其它编程语言经常称为布尔值,下面就来介绍R语言逻辑的应用。 条件运算产生逻辑值 > a <- 1 > b <- 2 > a>b [1] FALSE > a<b [1] T ...
2017-05-30R语言-线性模型假设检验 让我一起学习下gvlma包中的gvlma()函数。gvlma()函数由Pena和Slate(2006)编写,能对线性模型假设进行综合验证,同时还能做偏斜度、峰度和异方差性的评价。换句话说,它给模型假设提供 ...
2017-05-30R语言-如何处理回归中的异常值点 异常观测值 一个全面的回归分析要覆盖对异常值的分析,包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究,因为它们在一定程度上与其他观测点不同,可能对结 ...
2017-05-30R语言解读资本资产定价模型CAPM 伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...
2017-05-30SAS中的协方差分析 所谓的协方差分析,就是在方差分析的基础上加上协变量这一额外因素,而方差分析则只考虑组变量这一因素。协变量可以有一个,也可以有多个。 在这篇文章中,我只讲述单变量的协方差分析。 ...
2017-05-29R语言分类算法之随机森林 1.原理分析: 随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策树组成的随 ...
2017-05-29R语言实战k-means聚类和关联规则算法 1、R语言关于k-means聚类 数据集格式如下所示: [plain] view plain copy ,河东路与岙东路&河东路与聚贤桥路,河东路与岙东路&新悦路与岙东路,河东路与岙东路&火炬路与聚贤 ...
2017-05-29