首页 > 技术干货

- R语言之各种检验
2017-07-19
-
R语言之各种检验
1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验)
检验数据是否符合正态分布,R函数:shapiro.test().
结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为
...

- R语言t检验
2017-07-19
-
R语言t检验
I.单样本t检验
例1. 有原始数据的t检验
已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异?
x ...
- R语言逻辑回归、ROC曲线和十折交叉验证
2017-07-19
-
R语言逻辑回归、ROC曲线和十折交叉验证
自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。
1. 测试集和训练集3、7分组
[html] view plain copy ...
- R语言判别分析
2017-07-19
-
R语言判别分析
本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参 ...

- SAS逻辑回归之二分类
2017-07-18
-
SAS逻辑回归之二分类
数据集这里用的是australian,有14个自变量Xi,一个因变量Y,Y值只取0或1。
代码如下:
/*逻辑回归数据集australian(690个观测值,每个含14个属性,目标变量y(0、1))*/
/*导入 ...

- R语言关联规则
2017-07-18
-
R语言关联规则
# Apriori算法实现关联规则挖掘
#======================= MODEL1. 输入数据集为transaction类型 ======================
#install.packages(\"arules\") #Apriori算法程序包
lib ...

- R语言主成分分析
2017-07-18
-
R语言主成分分析
解决自变量之间的多重共线性和减少变量个数
根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一 ...

- R语言典型相关分析
2017-07-18
-
R语言典型相关分析
1 关键点:典型相关分析
典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系
例如 研究生入学考试成绩与本科 ...
- R语言因子分析
2017-07-18
-
R语言因子分析
因子模型: X=μ + A*F* + ε
其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。
I.参数估计
为了建立因子模型,需要要 ...
- R语言方差分析ANOVA
2017-07-18
-
R语言方差分析ANOVA
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。
I. 单因素方差分析
#用data frame的格式输入数据
medicine <- data.frame( ...

- SAS随机抽样以及程序初始环境
2017-07-17
-
SAS随机抽样以及程序初始环境
在统计研究中,针对容量无限或者容量很大以至于无法直接对其进行研究的总体,都是通过从中抽取一部分个体作为研究对象,以考察总体的特征。被抽取的部分个体称为该总体的一个样本 ...

- 一句python,一句R︱python中的字符串操作、中文乱码、NaN情况
2017-07-17
-
一句python,一句R︱python中的字符串操作、中文乱码、NaN情况
先学了R,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。
pandas可谓如雷贯耳, ...

- python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器
2017-07-17
-
python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器
新手入门Python,开始写一些简单函数,慢慢来,加油~
一、函数 +三个内建函数filter,map和reduce + if
1、def/lambda
def myadd(a=1,b=100) ...

- 一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
2017-07-17
-
一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
先学了R语言,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 ...

- R语言:异常值检验、离群点分析、异常值处理
2017-07-17
-
R语言:异常值检验、离群点分析、异常值处理
笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值)
异常值处理方 ...

- R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化)
2017-07-17
-
R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化)
分箱法在实际案例操作过程中较为常见,能够将一些数据离散化,等级化,比如年龄段,我们并不想知道确切的几岁,于是乎可以将其分组、分段。
基础 ...

- 数据质量分析
2017-07-16
-
数据质量分析
在数据分析和数据挖掘之前,我们首先要做的就是对数据进行预处理,将那些所谓的“脏数据”给去除掉,提高数据分析和挖掘的准确性和有效性。也就是说数据质量分析是数据挖掘和数据分析的重要开头。 ...

- 标准差 标准误 偏度系数和峰度系数的作用
2017-07-16
-
标准差 标准误 偏度系数和峰度系数的作用
标准差和标准误是两个不同的概念,标准差就是一个变量的所有数据的离均差平方和再平均之后开平方,它是度量离散程度的指标。标准误用于估计参数的可信区间,进行假设 ...

- 如何使用R来连接各个数据库
2017-07-16
-
如何使用R来连接各个数据库
在R语言越来越流行的情况下,也由于他开源的原因,他已经可以支持许多数据库。
现在,我就来总结一下:
(1)连接MySQL数据库
首先要下载加载RMySQL这个包。
加载的时候 ...

- 基于R语言构建的电影评分预测模型
2017-07-16
-
基于R语言构建的电影评分预测模型
电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。
一,前提准备
1.R语言包:ggplot2包(绘图),recommenderlab包,resh ...