CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言与简单的回归分析

R语言与简单的回归分析
2017-07-19
R语言与简单的回归分析 回归模型是计量里最基础也最常见的模型之一。究其原因,我想是因为在实际问题中我们并不知道总体分布如何,而且只有一组数据,那么试着对数据作回归分析将会是一个不错的选择。 一、 ...

R语言与显著性检验学习笔记

R语言与显著性检验学习笔记
2017-07-19
R语言与显著性检验学习笔记 一、何为显著性检验 显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一 ...

R语言之各种检验

R语言之各种检验
2017-07-19
R语言之各种检验 1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为 ...

R语言t检验

R语言t检验
2017-07-19
R语言t检验 I.单样本t检验 例1. 有原始数据的t检验 已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异? x ...
R语言逻辑回归、ROC曲线和十折交叉验证
2017-07-19
R语言逻辑回归、ROC曲线和十折交叉验证 自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。 1. 测试集和训练集3、7分组 [html] view plain copy ...
R语言判别分析
2017-07-19
R语言判别分析 本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参 ...

SAS逻辑回归之二分类

SAS逻辑回归之二分类
2017-07-18
SAS逻辑回归之二分类 数据集这里用的是australian,有14个自变量Xi,一个因变量Y,Y值只取0或1。 代码如下: /*逻辑回归数据集australian(690个观测值,每个含14个属性,目标变量y(0、1))*/ /*导入 ...

R语言关联规则

R语言关联规则
2017-07-18
R语言关联规则 # Apriori算法实现关联规则挖掘 #======================= MODEL1. 输入数据集为transaction类型 ====================== #install.packages(\"arules\") #Apriori算法程序包 lib ...

R语言主成分分析

R语言主成分分析
2017-07-18
R语言主成分分析 解决自变量之间的多重共线性和减少变量个数 根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一 ...

R语言典型相关分析

R语言典型相关分析
2017-07-18
R语言典型相关分析 1 关键点:典型相关分析 典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系 例如 研究生入学考试成绩与本科 ...
R语言因子分析
2017-07-18
R语言因子分析 因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。 I.参数估计 为了建立因子模型,需要要 ...
R语言方差分析ANOVA
2017-07-18
R语言方差分析ANOVA 自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。 I. 单因素方差分析 #用data frame的格式输入数据 medicine <- data.frame( ...

SAS随机抽样以及程序初始环境

SAS随机抽样以及程序初始环境
2017-07-17
SAS随机抽样以及程序初始环境 在统计研究中,针对容量无限或者容量很大以至于无法直接对其进行研究的总体,都是通过从中抽取一部分个体作为研究对象,以考察总体的特征。被抽取的部分个体称为该总体的一个样本 ...

一句python,一句R︱python中的字符串操作、中文乱码、NaN情况

一句python,一句R︱python中的字符串操作、中文乱码、NaN情况
2017-07-17
一句python,一句R︱python中的字符串操作、中文乱码、NaN情况 先学了R,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 pandas可谓如雷贯耳, ...

python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器

python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器
2017-07-17
python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器 新手入门Python,开始写一些简单函数,慢慢来,加油~ 一、函数 +三个内建函数filter,map和reduce + if 1、def/lambda def myadd(a=1,b=100) ...

一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)

一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
2017-07-17
一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重) 先学了R语言,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 ...

R语言:异常值检验、离群点分析、异常值处理

R语言:异常值检验、离群点分析、异常值处理
2017-07-17
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理方 ...

R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化)

R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化)
2017-07-17
R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化) 分箱法在实际案例操作过程中较为常见,能够将一些数据离散化,等级化,比如年龄段,我们并不想知道确切的几岁,于是乎可以将其分组、分段。 基础 ...

数据质量分析

数据质量分析
2017-07-16
数据质量分析 在数据分析和数据挖掘之前,我们首先要做的就是对数据进行预处理,将那些所谓的“脏数据”给去除掉,提高数据分析和挖掘的准确性和有效性。也就是说数据质量分析是数据挖掘和数据分析的重要开头。 ...

标准差 标准误 偏度系数和峰度系数的作用

标准差 标准误 偏度系数和峰度系数的作用
2017-07-16
标准差 标准误 偏度系数和峰度系数的作用 标准差和标准误是两个不同的概念,标准差就是一个变量的所有数据的离均差平方和再平均之后开平方,它是度量离散程度的指标。标准误用于估计参数的可信区间,进行假设 ...

OK