SAS-数据科学专业问答社区-CDA答疑社区

CDA数据科学研究院 CDA考试中心 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部

关于CDA APP下载

免密码登录

提交首次登录验证后自动注册

展开 +

Python 在数据分析工作中的地位与 R 语言、SAS、S

spss对用户的要求是只要会点击菜单就可以了，有编程窗口但是一般没人用，用户多是收到过一些统计训练的，但不需要高深的分析能力，市场调研用的比较多，统计专业大二一般要求掌握sas内装许多写好的procedure 而且都是经过Fda认证的有保障的东西所以死贵好处是权威坏处是不够灵活算法更新慢还有死贵。语法奇怪不是那种传统意义上做编程的语言所以循环啊什么的涉及算法的会不那么方便，也不是

0.0000 0 3

SEMMA方法

SAS公司的数据挖掘项目实施方法论，成为SEMMA方法。5个步骤中的主要任务，如下图所示。

0.0000 0 2

SEMMA方法

5个步骤中的主要任务，如图：（1）数据整理涉及数据采集、数据合并与抽样的操作，目的是为了构造分析用到的数据。分析人员根据维度分析获得的结果作为整理数据的依据，将散落在公司内部与外部的数据进行整合。（2）样本探索这个步骤的主要任务是对数据质量的探索。变量质量方面涉及错误值（年龄=-30）、恰当性（客户的某些业务指标为缺失值，实际上是没有这个业务，值应该为“0”）、缺失值（没有客户

0.1790 1 3

啊啊啊啊啊吖

R里的apply、sapply、tapply函数的区别

1、apply函数对一个Matrix或者Array进行某个维度的运算。其格式是： apply(数据,维度Index,运算函数,函数的参数) 对于Matrix来说，其维度值为2，第二个参数维度Index中，1表示按行运算，2表示按列运算。例子： > m m [,1] [,2] [,3][1,] 1 3 5[2,] 2

0.0000 0 4

啊啊啊啊啊吖

SAS字符串连接符和字符连接函数学习分享

1、字符串连接符包括|| ¦¦ !!等例1：data _null_; a=

0.0000 0 2

啊啊啊啊啊吖

数值型与字符型相互变换

我有两组月度数据，一边里面的year month是字符型Length 12., Format12,informat12.。另一个是数值型length 8 Format Best12.,informat Best32.这两个要怎么转换成一个类型然后用merge呢？data a1; input a b @@; cards; 23 45 34 34 54 34 ; run; data _

0.0000 0 5

啊啊啊啊啊吖

缺失值查询

数据清洗技术是统计分析之前必做的一步，而且也是非常麻烦的一步，有时甚至花费的时间比统计分析都长。所以没有一定的技巧，这将是个非常烦人的工作。本篇文章介绍如何利用sas进行缺失值的查询工作，后面如果有时间再逐渐写一下异常值、错误值等的查询。假定我们有数据集aa，包含如下变量（数据省略）：ID dose gender age t0 t1 a1 a2最简单的方式当然就是挨个变量找缺失值，如下：d

0.0000 0 5

啊啊啊啊啊吖

学习笔记贴，数据集分组并在各组内排名

为简明起见，我以sashelp.class 为例，介绍如何对对数据集按性别分成男、女两组，并按身高（height）从矮到高排列。sashelp.class 原表如下：Obs Name Sex Age Height Weight 1 Joyce F 11 51.3 50.5 2 Louise

0.0000 0 2

啊啊啊啊啊吖

导入数据的时候如何改变字符型变量的长度

在把excel数据导入sas时，有一个字段的字符很长，超过默认长度，导致导入sas数据集的该字段不完整，请问需要怎样编写语句才能够改变其长度？导入的excel最后没有形成sas数据集，而是一个导入的程序？怎样看到导入后的数据集PROC IMPORT OUT= WORK.AA DATAFILE= "F:\AA.XLS" DBMS=EXCEL REP

0.0000 0 3

啊啊啊啊啊吖

如何改日期为年月日

原来的数据是四位数字的年度日期（比如2009）现在想在每个日期后加上1231，就是每年的12月31日。希望仍然是日期格式，比如2009年，想改成2009年12月31日（20091231），不知道有办法改不？就是把所有年度数据后面都加上1231，格式还是日期格式。解决方法参考：Using MYD function if the arguments are numeric.18

0.0000 0 1

逐梦的太阳

[SAS问题]如何实现批量导出逻辑库数据操作？

data pop_21sheep pop_22sheep;set work.fxsheep; if city in ('3421') then output pop21sheep; if city in ('3422') then output pop22sheep;run;proc sort data =pop_21sheep ;by vi

0.0000 0 4

啊啊啊啊啊吖

学习一波~刚刚在工作中遇到的缺失值问题，解决了

即一个变量var从第n行开始出现值，那么怎么变成新变量New_var 即第n行之前的记录仍为空值，第n后出现的空值变为字符串"缺失"。data test; infile cards missover; inputid $var $;cards;1 1 A1 1 B;run;data want; set test; r

35.3866 5 2

sas结构方程原来也很强

sas结构方程很美，但图形好像很难调整，不知是不是我没找对地方。spss的amos图形调整起来好像很便利，不知sas能不能通过语法调整。结构方程技术为社会科学计量分析工作者所钟爱。结构方程有效地整合了各种统计方法，可以实现复杂变量间的路径关系，尤其是多因变量的问题。可以认为这种技术是解决面的问题的一种特有的方法。1）先验理论性 SEM模型的“一边”是先验理论导出的协方差结构，“一边”是样

187.1009 8 1

核密度工作原理及实现

SAS的KDE过程实现核密度估计，功能及其说明如下：可以对单变量和双变量进行核密度估计，所谓的核（kernel）估计是一种非参数方法，是指从原始数据中观测到的概率密度函数（PDF）——平均的通过数据点，从而创建平滑曲线。 KDE过程使用高斯密度做为核，并假设其方差决定平滑的结果。其工作原理：选择带宽（bandwith），进而核密度估计，但完成这些工作前提是完成数据的分箱

214.5274 12 7

快速发帖我要提问

数据分析师求职、备考、笔试
刷题神器！

社区福利马上领

热门用户换一批

: 詹惠儿

: 赵娜0418

: shauna570392

: 啊啊啊啊啊吖

: liting李

: 读童话的狼

本月PGC排行

总奖励

暂无数据