CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

试卷或问卷的可靠度分析

试卷或问卷的可靠度分析
2017-04-22
试卷或问卷的可靠度分析 输入你想编的case数目,操作方法:只要将这个程序粘贴到SPSS的脚本窗口,点击RUN即可。到时需要多少记录由你来定。 Sub Main Dim strCmd As String Dim vNbCases As Variant Dim lngN ...

spss操作(Z)

spss操作(Z)
2017-04-22
spss操作(Z) 一、数据定义(data definition) 使计算机能够正确的辨认量化的数据,并对于数据赋予正确的意义。 变量名称指定(变量标签)、变量数值的标签、变量的格式类型、遗漏值的设定。 数据定义必需 ...

spss里面table的syntax解释

spss里面table的syntax解释
2017-04-22
spss里面table的syntax解释 * Custom Tables. CTABLES /VLABELS VARIABLES=status time(参与交叉分析的变量)DISPLAY=DEFAULT /TABLEtime[MEDIAN COMMA40.1] BYstatus(1、by后面的是行变量,前面的是列变 ...
SPSS的特点
2017-04-22
SPSS的特点 1、 操作简单:除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过“菜单”、“按钮”和“对话框”来完成。 2、 无须编程:具有第四代语言的特点,告诉系统要做什么, ...

R语言函数收藏||字符串处理-grep/grepl/sub/gsub

R语言函数收藏||字符串处理-grep/grepl/sub/gsub
2017-04-21
R语言函数收藏||字符串处理-grep/grepl/sub/gsub 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要 ...
R语言处理大规模数据集的编程要点
2017-04-21
R语言处理大规模数据集的编程要点 1.提高程序效率,保证执行速度 (1)尽量使用向量化运算 (2)尽量使用矩阵,必要时才使用数据框 (3)使用read.table时,尽量显式设定colClasses和nrows,设定comment.cha ...

R语言各种假设检验实例整理

R语言各种假设检验实例整理
2017-04-21
一、正态分布参数检验 例1.某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 ...

如何使用R语言解决可恶的脏数据

如何使用R语言解决可恶的脏数据
2017-04-21
如何使用R语言解决可恶的脏数据 在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。 脏数据的存在形式主要有如下几种 ...

一个使用R语言做数据处理的实例

一个使用R语言做数据处理的实例
2017-04-21
一个使用R语言做数据处理的实例 最近一个同学找到我,希望我帮忙处理一份数据。那份数据是这样的:包含了3661行,第一行为各列的名称;包含8列,第一列为专利ID,其余7列为企业ID。 这份数据截图如下所示: ...

用R语言做Venn(韦恩)图

用R语言做Venn(韦恩)图
2017-04-21
用R语言做Venn(韦恩)图 首先介绍一下韦恩图(英语:Venn diagram) ,也叫做文氏图、温氏图、范氏图,这都一个意思。它是数学学科中分支集合论(或者类的理论)的一支,在不太严格的意义下用来表示集合(或 ...

R语言与格式、日期格式、格式转化

R语言与格式、日期格式、格式转化
2017-04-20
R语言与格式、日期格式、格式转化 R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。基本总结如下 ...

R语言中plyr包

R语言中plyr包
2017-04-20
R语言中plyr包 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例 ...

R语言数据集合并、数据增减、不等长合并

R语言数据集合并、数据增减、不等长合并
2017-04-20
R语言数据集合并、数据增减、不等长合并 数据选取与简单操作: 一、数据合并 1、merge()函数 最常用merge()函数,但是这个函数使用时候这两种情况需要注意: 1、merge(a,b),纯粹地把两个数据集 ...

R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解)

R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解)
2017-04-20
R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解) 与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词。大致分析步骤如 ...

R语言实现关系图谱

R语言实现关系图谱
2017-04-20
R语言实现关系图谱 数据是这样存储的 社交关系分析和可视化用的是igraph包 脚本是这样的 ------------------------------------------------------------------------------------------- #ins ...

R语言之文本挖掘--分词

R语言之文本挖掘--分词
2017-04-20
R语言之文本挖掘--分词 当前对文本挖掘的需求越来越多,而基于文本挖掘又可以实现舆情监控、文本分类、关联分析和趋势预测等。 本文主要使用李舰发布的中文分词包Rwordseg。该包引用了@ansj开发的ansj中文 ...

SAS宏中两个常用的options选项

SAS宏中两个常用的options选项
2017-04-19
SAS宏中两个常用的options选项 一、关于SAS中options选项msglevel msglevel:默认值是N(默认是关闭的),仅打印notes,warnings和error信息,如果设为I,则除了打印N选项的信息,同时打印附属信息,包括索 ...

SAS、R如何手动输入数据

SAS、R如何手动输入数据
2017-04-19
SAS、R如何手动输入数据 一道简单的题目,将下面的数据分别手动输入到SAS和R中,如何实现? 一、SAS 解决方案: data cust_base_info; inputcust_no$ name$sex$ is_marri ...

sas字符变量基于bad_rate分组

sas字符变量基于bad_rate分组
2017-04-19
sas字符变量基于bad_rate分组 最近因为模型拟合的不理想的原因,sas信用评分的内容可能要停更一两周了,因为我还没能进行到模型评分卡这一步就被跨期验证给拍下来了,我做的模型,训练的数据以及测试的数据指标 ...

sas批量删除重复超过90%的变量

sas批量删除重复超过90%的变量
2017-04-19
sas批量删除重复超过90%的变量 22年前的今天我的妈咪把我带来这个世界,费尽心思把我养到这么大,我就是4月份出生的大白羊,我的生日愿望呢,就是想有个大神在留言板块教我一个怎么识别组合变量更好解释因变量 ...

OK