数据分析师

首页 > 技术干货

R语言:数据去重

R语言:数据去重

源自:CDA数据分析师 | 发布时间:2017-04-25 13:30:58

R语言:数据去重 查看重复的方式,有点像分类变量个数一样,unique()  或者 table()  都是很好的方式去检测。 1、unique函数 [plain] view plai ... ...

R语言:基本函数、统计量、常用操作函数

R语言:基本函数、统计量、常用操作函数

源自:CDA数据分析师 | 发布时间:2017-04-25 13:28:06

R语言:基本函数、统计量、常用操作函数 先言:R语言常用界面操作 帮助:help(nnet) = ?nnet =??nnet 清除命令框中所有显示内容:Ctrl+L 清除R空间中内存 ... ...

R语言:构造新序列

R语言:构造新序列

源自:CDA数据分析师 | 发布时间:2017-04-25 13:19:46

R语言:构造新序列 1、数值构造函数rep与seq [plain] view plain copy print?在CODE上查看代码片派生到我的代码片 #数值构造rep与seq rep(1:4,each=2)#依次重复1:4两遍 rep(1:4,2) #注意,重复1:4两遍 ...

R语言:排序问题

R语言:排序问题

源自:CDA数据分析师 | 发布时间:2017-04-25 07:31:04

R语言:排序问题 数据排序 1、sort(),rank(),order()函数 Sort 排序(默认升序,decreasing=T时为降序) Order 排序(默认升序,decreasing=T时为降序) 在R中,和排序相关的函数主要有三个:sort(),rank() ...

常用的spss命令程序

常用的spss命令程序

源自:CDA数据分析师 | 发布时间:2017-04-24 20:38:21

常用的spss命令程序 1.加标签程序 VARIABLE LABELS S1 \"S1 How long have you lived here\". 2.加值程序 value labels TIER 1 \"Tier1\" 2 \"Tier2\" 3 \"Tier3\" 4 \"Tier4\". 3.求均值程序 MEANS ...

SPSS正交设计的操作

SPSS正交设计的操作

源自:CDA数据分析师 | 发布时间:2017-04-24 20:35:17

SPSS正交设计的操作 设要做二因素的正交设计,A因素有三个水平,B因素有两个水平。则选择Data-->Orthogonal Design-->generate,弹出的就是正交设计窗口: Factor name框:输入A:单击ADD钮:单击Define val ...

Spss中syntax语句运用实例

Spss中syntax语句运用实例

源自:CDA数据分析师 | 发布时间:2017-04-24 12:53:11

Spss中syntax语句运用实例 Spss syntax 语句运用实例 Sort 命令 Sort cases by age. Select cases命令(filter) USE ALL. COMPUTE filter_$=(r26 < 1 & r26 > 4). VARIABLE LABEL filter_$ ...

配对样本的T检验和相关样本检验有何差别

配对样本的T检验和相关样本检验有何差别

源自:CDA数据分析师 | 发布时间:2017-04-24 12:51:05

配对样本的T检验和相关样本检验有何差别 最近有很多朋友问我关于如何运用spss配对样本的T检验和相关样本检验有何差别? 配对样本有同源配对(如动物实验中双胞胎)、条件配对(如相同的环境)、自身配对(如 ...

python学习笔记—使用dict和set

python学习笔记—使用dict和set

源自:CDA数据分析师 | 发布时间:2017-04-23 13:29:33

python学习笔记—使用dict和set 使用dict和set (一)dict Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 1.定义字典 字典由 ...

Python学习笔记—使用list和tuple

Python学习笔记—使用list和tuple

源自:CDA数据分析师 | 发布时间:2017-04-23 13:25:49

Python学习笔记—使用list和tuple (一)List 1.Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。 比如,列出班里所有同学的名字,就可以用一个list表示: >>> ...

Spss的基本方法使用步骤

Spss的基本方法使用步骤

源自:CDA数据分析师 | 发布时间:2017-04-23 13:18:07

Spss的基本方法使用步骤 由于一次的调研工作,我们的数据分析采用spss的统计分析工具,然后我是一个新人,全都是一步一步从零开始操作的。在学习的过程中简单记录了一点笔记,既然写了,就觉得应该把它保存下来 ...

R语言︱用excel VBA把xlsx批量转化为csv格式

R语言︱用excel VBA把xlsx批量转化为csv格式

源自:CDA数据分析师 | 发布时间:2017-04-23 07:23:41

R语言︱用excel VBA把xlsx批量转化为csv格式 在上面的尝试已经发现,xlsx本身就是这个复杂问题的最根本原因。与之相反,R对csv等文本格式支持的很好,而且有fread这个神器,要处理一定量级的数据,还是得把xlsx ...

R与Excel之数据分析

R与Excel之数据分析

源自:CDA数据分析师 | 发布时间:2017-04-22 13:22:37

R与Excel之数据分析 Excel 是一款很好用的数据分析工具,但是你分析数据时只有 Excel 这一款工具的话,则会大大影响工作效率。相比之下,R 工具更好用,而且提供的工具集模块更完整。 我从事数据分析工作已 ...

这些Excel学会了,你做账的效率将大大提高

这些Excel学会了,你做账的效率将大大提高

源自:CDA数据分析师 | 发布时间:2017-04-22 13:18:07

这些Excel学会了,你做账的效率将大大提高 这些功能学会了,工作效率将大大提高。 1、excel的快速访问工具栏: 我的快速访问工具栏由左到右主要是“保存”、“新建”、“撤销”、“恢复”、“升序 ...

试卷或问卷的可靠度分析

试卷或问卷的可靠度分析

源自:CDA数据分析师 | 发布时间:2017-04-22 07:21:13

试卷或问卷的可靠度分析 输入你想编的case数目,操作方法:只要将这个程序粘贴到SPSS的脚本窗口,点击RUN即可。到时需要多少记录由你来定。 Sub Main Dim strCmd As String Dim vNbCases As Variant Dim lngN ...

spss操作(Z)

spss操作(Z)

源自:CDA数据分析师 | 发布时间:2017-04-22 07:10:42

spss操作(Z) 一、数据定义(data definition) 使计算机能够正确的辨认量化的数据,并对于数据赋予正确的意义。 变量名称指定(变量标签)、变量数值的标签、变量的格式类型、遗漏值的设定。 数据定义必需 ...

R语言函数收藏||字符串处理-grep/grepl/sub/gsub

R语言函数收藏||字符串处理-grep/grepl/sub/gsub

源自:CDA数据分析师 | 发布时间:2017-04-21 13:27:57

R语言函数收藏||字符串处理-grep/grepl/sub/gsub 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要 ...

R语言处理大规模数据集的编程要点

源自:CDA数据分析师 | 发布时间:2017-04-21 13:24:36

R语言处理大规模数据集的编程要点 1.提高程序效率,保证执行速度 (1)尽量使用向量化运算 (2)尽量使用矩阵,必要时才使用数据框 (3)使用read.table时,尽量显式设定colClasses和nrows,设定comment.cha ...

R语言各种假设检验实例整理

R语言各种假设检验实例整理

源自:CDA数据分析师 | 发布时间:2017-04-21 13:16:43

一、正态分布参数检验 例1.某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 ...

如何使用R语言解决可恶的脏数据

如何使用R语言解决可恶的脏数据

源自:CDA数据分析师 | 发布时间:2017-04-21 07:18:46

如何使用R语言解决可恶的脏数据 在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。 脏数据的存在形式主要有如下几种 ...

R语言与格式、日期格式、格式转化

R语言与格式、日期格式、格式转化

源自:CDA数据分析师 | 发布时间:2017-04-20 13:12:38

R语言与格式、日期格式、格式转化 R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。基本总结如下 ...

R语言中plyr包

R语言中plyr包

源自:CDA数据分析师 | 发布时间:2017-04-20 13:02:56

R语言中plyr包 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例 ...

CDA数据分析师周边