[SAS 测试语法]变数门限回归 今天介绍正在测试中的语法 变数门限回归 首先,创造一个虚拟q, 该虚拟变量唯一个随机数值,我们假设这个变量造成了结构性改变 形成了两种回归式 (是的,我们的回归 ...
2017-06-01
sas—日期格式及函数 很久不用sas了,把日期的格式给忘了,重新学习下。 前不久,有个同事问我怎么把 date9.如“21jan2016”d 的格式换成yymmdd10. 2016-01-21的格式; 用informat设定好变量格式即可。 ...
2017-06-01SAS—计算K-S值及画图 近来,时于夜半下雨,也常在梦里被雨扰醒。究其原因,也是因为近来工作无趣,本身也只喜欢写写SAS或Python代码,做模型,可近来却连数据权限都没有,万灰俱灭。雨声轻轻,却也容易愁闷得 ...
2017-06-01
【R语言】单一样本推断问题 非参数统计概念: 在实际问题中,对数据的分布形式和统计模型难以作出比较明确的假定,最多只能对总体的分布做出类似于连续性型分布或者对某点对称等一般性假定。这种不假设总体 ...
2017-05-31
R语言-组间差异的非参数检验 7.5 组间差异的非参数检验 如果数据无法满足t检验或ANOVA的参数假设,可以转而使用非参数方法。举例来说,若结果变量在本质上就严重偏倚或呈现有序关系,那么你可能会希望使用本节 ...
2017-05-31
R语言-回归之简单线性回归 8.1 回归的多面性 回归是一个令人困惑的词,因为它有许多特殊变种(见表8-1)。对于回归模型的拟合, R提供的强大而丰富的功能和选项也同样令人困惑。例如, 2005年Vito Ricc ...
2017-05-31
R语言-有交互项的多元线性回归 许多很有趣的研究都会涉及交互项的预测变量。以mtcars数据框中的汽车数据为例,若你对汽车重量和马力感兴趣,可以把它们作为预测变量,并包含交互项来拟合回归模型,参见代码清单 ...
2017-05-31
R语言-如何处理违背回归假设的问题 我们已经花费了不少篇幅来学习回归诊断,你可能会问:“如果发现了问题,那么能做些什么呢?”有四种方法可以处理违背回归假设的问题: 删除观测点; 变量变换; 添加或删除 ...
2017-05-31
R语言解读多元线性回归模型 在许多生活和工作的实际问题中,影响因变量的因素可能不止一个,比如对于知识水平越高的人,收入水平也越高,这样的一个结论。这其中可能包括了因为更好的家庭条件,所以有了更好的 ...
2017-05-31
R语言里面的因子 R语言中的因子确实不好理解,很多人都这么觉得。在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2 ...
2017-05-30
R语言自定义函数 R语言某种程度来说本身就是一个函数库,因为它有大量的函数可供调用,加上函数式编程,使得R语言的功能很强大。但是,有时候,根据实际需要,我们还是需要自己动手编写函数,从而减少代码的缀 ...
2017-05-30
R语言逻辑运算 R语言包括两个逻辑值:TRUE、FALSE,其它编程语言经常称为布尔值,下面就来介绍R语言逻辑的应用。 条件运算产生逻辑值 > a <- 1 > b <- 2 > a>b [1] FALSE > a<b [1] T ...
2017-05-30
R语言-线性模型假设检验 让我一起学习下gvlma包中的gvlma()函数。gvlma()函数由Pena和Slate(2006)编写,能对线性模型假设进行综合验证,同时还能做偏斜度、峰度和异方差性的评价。换句话说,它给模型假设提供 ...
2017-05-30
R语言-如何处理回归中的异常值点 异常观测值 一个全面的回归分析要覆盖对异常值的分析,包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究,因为它们在一定程度上与其他观测点不同,可能对结 ...
2017-05-30
R语言解读资本资产定价模型CAPM 伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...
2017-05-30
SAS中的协方差分析 所谓的协方差分析,就是在方差分析的基础上加上协变量这一额外因素,而方差分析则只考虑组变量这一因素。协变量可以有一个,也可以有多个。 在这篇文章中,我只讲述单变量的协方差分析。 ...
2017-05-29
R语言分类算法之随机森林 1.原理分析: 随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策树组成的随 ...
2017-05-29
R语言实战k-means聚类和关联规则算法 1、R语言关于k-means聚类 数据集格式如下所示: [plain] view plain copy ,河东路与岙东路&河东路与聚贤桥路,河东路与岙东路&新悦路与岙东路,河东路与岙东路&火炬路与聚贤 ...
2017-05-29
R语言实现人工神经网络预测 R语言中很多包(package)关于神经网络,例如nnet、AMORE、neuralnet以及RSNNS。nnet提供了最常见的前馈反向传播神经网络算法。AMORE包则更进一步提供了更为丰富的控制参数,并可以 ...
2017-05-29
SAS中最常用的10个命令 SAS是乔伊平时学习中常用到的数据处理软件之一。在处理大批量数据时,SAS不能说太好用呢。SAS也是学习起来十分简单的一个软件,掌握一些基本的命令,就可以满足日常的数据处理需求。 ...
2017-05-29在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12