CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言:数据规范化、归一化

R语言:数据规范化、归一化
2017-04-29
R语言:数据规范化、归一化 笔者寄语:规范化主要是因为数据受着单位的影响较大,需要进行量纲化。大致有:最小-最大规范化、均值标准化、小数定标规范化 数据中心化和标准化的意义是一样的,为了消除量纲对数 ...

R语言:异常值检验、离群点分析、异常值处理

R语言:异常值检验、离群点分析、异常值处理
2017-04-29
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理 ...
R语言:函数使用技巧(循环、if族/for、switch、repeat、ifelse、stopifnot)
2017-04-29
R语言:函数使用技巧(循环、if族/for、switch、repeat、ifelse、stopifnot) 1、循环 [plain] view plain copy print?在CODE上查看代码片派生到我的代码片 ##循环for iris allzl=unique(iris$setosa) ...

R语言:分布函数与概率密度+随机数产生

R语言:分布函数与概率密度+随机数产生
2017-04-29
R语言:分布函数与概率密度+随机数产生 1、常见概率分布 [plain] view plain copy print?在CODE上查看代码片派生到我的代码片 ##正态分布 pnorm(1.96) #P(x<=1.96)时的分布概率 pnorm(1.96,0,1) #上同 ...

支持向量机(SVM)理论总结系列.线性可分(附带R程序案例:用体重和心脏重量来预测一只猫的性别)

支持向量机(SVM)理论总结系列.线性可分(附带R程序案例:用体重和心脏重量来预测一只猫的性别)
2017-04-28
支持向量机(SVM)理论总结系列.线性可分(附带R程序案例:用体重和心脏重量来预测一只猫的性别) 1.名词解释 支持向量机中的机:在机器学习领域,常把一些算法看做一个机器,如分类机(也叫作分类器) 2.问题 ...

R语言中如何使用最小二乘法

R语言中如何使用最小二乘法
2017-04-28
R语言中如何使用最小二乘法 这里只是介绍下R语言中如何使用最小二乘法解决一次函数的线性回归问题。 代码如下: > x<-c(6.19,2.51,7.29,7.01,5.7,2.66,3.98,2.5,9.1,4.2) > y<-c(5.25,2.83,6.41,6.71,5.1,4.23 ...

机器学习:形如抛物线的散点图在python和R中的非线性回归拟合方法

机器学习:形如抛物线的散点图在python和R中的非线性回归拟合方法
2017-04-28
机器学习:形如抛物线的散点图在python和R中的非线性回归拟合方法 对于样本数据的散点图形如函数y=ax2+bx+c的图像的数据, 在python中的拟合过程为: ##最小二乘法 import numpy as np import scipy as sp impor ...

R语言基因组数据分析可能会用到的data.table函数整理

R语言基因组数据分析可能会用到的data.table函数整理
2017-04-28
R语言基因组数据分析可能会用到的data.table函数整理 R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完 ...
将基因组数据分类并写出文件,python,awk,R data.table速度PK
2017-04-28
将基因组数据分类并写出文件,python,awk,R data.table速度PK 由于基因组数据过大,想进一步用R语言处理担心系统内存不够,因此想着将文件按染色体拆分,发现python,awk,R 语言都能够非常简单快捷的实现, ...
R语言实现对基因组SNV进行注释
2017-04-28
R语言实现对基因组SNV进行注释 很多时候,我们需要对取出的SNV进行注释,这个时候可能会在R上进行注释,通常注释文件都含有Chr(染色体)、Start(开始位点)、End(结束位点)、Description(描述),而我们的SNV文 ...

SPSS详细操作:一致性检验和配对卡方检验

SPSS详细操作:一致性检验和配对卡方检验
2017-04-27
SPSS详细操作:一致性检验和配对卡方检验 一、问题与数据 有两种方法可用于诊断某种癌症,A方法简单易行,成本低,患者更容易接受,B方法结果可靠,但操作繁琐,患者配合困难。某研究选择了53例待诊断的门 ...

手把手教你协方差分析的SPSS操作

手把手教你协方差分析的SPSS操作
2017-04-27
手把手教你协方差分析的SPSS操作 一、问题与数据 某研究将73例脑卒中患者随机分为现代理疗组(38例)和传统康复疗法组(35例)进行康复治疗,采用Fugl-Meyer运动功能评分法(FMA)分别记录治疗前、后的运动 ...

SPSS详细操作:样本均数间的多重比较

SPSS详细操作:样本均数间的多重比较
2017-04-27
SPSS详细操作:样本均数间的多重比较 下面我们用例子来探讨:方差分析得出各组总体均数间的差异有统计学意义之后,如何进行样本均数间的多重比较。 一、问题与数据 为调查A、B、C三种治疗措施对患者谷丙 ...

SPSS实例教程:无序多分类Logistic回归

SPSS实例教程:无序多分类Logistic回归
2017-04-27
SPSS实例教程:无序多分类Logistic回归 1、问题与数据 为了探讨基因X突变与恶性肿瘤Y不同组织类型发生风险的关系,某医生设计了一项病例对照研究。该医生纳入所在科室一年收治的145名该恶性肿瘤患者,并从 ...

SPSS实例教程:有序多分类Logistic回归

SPSS实例教程:有序多分类Logistic回归
2017-04-27
SPSS实例教程:有序多分类Logistic回归 1、问题与数据 在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济水平的关系,以确定胃癌筛查的重点人群。为了避免性别因素对结论的混杂影响,研究 ...

这个excel功能,对财务利润分析太有用了

这个excel功能,对财务利润分析太有用了
2017-04-26
这个excel功能,对财务利润分析太有用了 excel中有一个功能,很多人不知道它怎么用,即使会用了,又不知道它是干啥用的。它就是:单变量求解。今天用一个非常非常实用的示例来介绍它的用途。 【例】如下图所 ...

excel中分数输入法竟如此简单

excel中分数输入法竟如此简单
2017-04-26
excel中分数输入法竟如此简单 excel录入分数的时候,一不小心就会被转换为日期值,难道在excel输入完美的分数就这么难吗? 其实,只要找对了方法,一点都不难。96871君图文详解excel中输入分数的方法。 如图 ...

假设检验:正态性检验,单样本t检验,配对t检验

假设检验:正态性检验,单样本t检验,配对t检验
2017-04-26
假设检验:正态性检验,单样本t检验,配对t检验 最开始的是正态性检验,但很多情况下大家都不做,这其实不是很严谨。正态性检验指的是检验样本是否来自正态分布的总体。对于医学很多实验结果,我们想要应用一些检 ...

t检验及其SPSS运用

t检验及其SPSS运用
2017-04-26
t检验及其SPSS运用 今天我们来介绍假设检验中一个极其常用的方法——t检验。我们将分为两部分介绍这一统计学界的“明星”方法,今天的推送中主要介绍单样本t检验,接下来将会介绍配对样本t检验和独立样本t检验 ...

单样本t检验的spss实现

单样本t检验的spss实现
2017-04-26
单样本t检验的spss实现 直接来看一个例子: 常规种植条件下某玉米品的平均穗重为 300g 。现在采用根外施肥(即将肥料制成液体养分,喷洒到玉米的叶面)后,调查了 20 个玉米棒 ,其穗重如表 1所示。问:改用 ...

OK