wo56565

Python 在数据分析工作中的地位与 R 语言、SAS、S

spss对用户的要求是只要会点击菜单就可以了,有编程窗口但是一般没人用,用户多是收到过一些统计训练的,但不需要高深的分析能力,市场调研用的比较多,统计专业大二一般要求掌握sas内装许多写好的procedure 而且都是经过Fda认证的 有保障的东西 所以死贵好处是权威 坏处是不够灵活 算法更新慢 还有 死贵。语法奇怪 不是那种传统意义上做编程的语言 所以循环啊什么的涉及算法的会不那么方便,也不是

0.0000 0 3
  • 关注作者
  • 收藏
zxq997

SEMMA方法

SAS公司的数据挖掘项目实施方法论,成为SEMMA方法。5个步骤中的主要任务,如下图所示。

0.0000 0 2
  • 关注作者
  • 收藏
zxq997

SEMMA方法

5个步骤中的主要任务,如图: (1)数据整理涉及数据采集、数据合并与抽样的操作,目的是为了构造分析用到的数据。分析人员根据维度分析获得的结果作为整理数据的依据,将散落在公司内部与外部的数据进行整合。(2)样本探索这个步骤的主要任务是对数据质量的探索。变量质量方面涉及错误值(年龄=-30)、恰当性(客户的某些业务指标为缺失值,实际上是没有这个业务,值应该为“0”)、缺失值(没有客户

0.1790 1 3
  • 关注作者
  • 收藏
啊啊啊啊啊吖

R里的apply、sapply、tapply函数的区别

1、apply函数 对一个Matrix或者Array进行某个维度的运算。其格式是: apply(数据,维度Index,运算函数,函数的参数) 对于Matrix来说,其维度值为2,第二个参数维度Index中,1表示按行运算,2表示按列运算。例子: > m m [,1] [,2] [,3][1,] 1 3 5[2,] 2

0.0000 0 4
  • 关注作者
  • 收藏
啊啊啊啊啊吖

SAS字符串连接符和字符连接函数学习分享

1、字符串连接符包括|| ¦¦ !!等例1:data _null_; a=

0.0000 0 2
  • 关注作者
  • 收藏
啊啊啊啊啊吖

数值型与字符型相互变换

我有两组月度数据,一边里面的year month是字符型Length 12., Format12,informat12.。另一个是数值型length 8 Format Best12.,informat Best32.这两个要怎么转换成一个类型然后用merge呢?data a1; input a b @@; cards; 23 45 34 34 54 34 ; run; data _

0.0000 0 5
  • 关注作者
  • 收藏
啊啊啊啊啊吖

缺失值查询

数据清洗技术是统计分析之前必做的一步,而且也是非常麻烦的一步,有时甚至花费的时间比统计分析都长。所以没有一定的技巧,这将是个非常烦人的工作。本篇文章介绍如何利用sas进行缺失值的查询工作,后面如果有时间再逐渐写一下异常值、错误值等的查询。假定我们有数据集aa,包含如下变量(数据省略):ID dose gender age t0 t1 a1 a2最简单的方式当然就是挨个变量找缺失值,如下:d

0.0000 0 5
  • 关注作者
  • 收藏
啊啊啊啊啊吖

学习笔记贴,数据集分组并在各组内排名

为简明起见,我以sashelp.class 为例,介绍如何对对数据集按性别分成男、女两组,并按身高(height)从矮到高排列。sashelp.class 原表如下:Obs    Name       Sex    Age    Height    Weight   1    Joyce       F      11     51.3       50.5   2    Louise 

0.0000 0 2
  • 关注作者
  • 收藏
啊啊啊啊啊吖

导入数据的时候如何改变字符型变量的长度

在把excel数据导入sas时,有一个字段的字符很长,超过默认长度,导致导入sas数据集的该字段不完整,请问需要怎样编写语句才能够改变其长度?导入的excel最后没有形成sas数据集,而是一个导入的程序?怎样看到导入后的数据集PROC IMPORT OUT= WORK.AA            DATAFILE= "F:\AA.XLS"            DBMS=EXCEL REP

0.0000 0 3
  • 关注作者
  • 收藏
啊啊啊啊啊吖

如何改日期为年月日

原来的数据是四位数字的年度日期(比如2009)现在想在每个日期后加上1231,就是每年的12月31日。希望仍然是日期格式,比如2009年,想改成2009年12月31日(20091231),不知道有办法改不?就是把所有年度数据后面都加上1231,格式还是日期格式。解决方法参考:Using MYD function if the arguments are numeric.18    

0.0000 0 1
  • 关注作者
  • 收藏
逐梦的太阳

[SAS问题]如何实现批量导出逻辑库数据操作?

data pop_21sheep pop_22sheep;set work.fxsheep; if city in ('3421') then output pop21sheep; if city in ('3422') then output pop22sheep;run;proc sort data =pop_21sheep ;by vi

0.0000 0 4
  • 关注作者
  • 收藏
啊啊啊啊啊吖

学习一波~刚刚在工作中遇到的缺失值问题,解决了

即一个变量var从第n行开始出现值,那么怎么变成新变量New_var 即第n行之前的记录仍为空值,第n后出现的空值变为字符串"缺失"。data test;   infile cards missover;   inputid $var $;cards;1  1 A1  1 B;run;data want;   set test;   r

35.3866 5 2
  • 关注作者
  • 收藏
有福有德

sas结构方程原来也很强

sas结构方程很美,但图形好像很难调整,不知是不是我没找对地方。spss的amos图形调整起来好像很便利,不知sas能不能通过语法调整。结构方程技术为社会科学计量分析工作者所钟爱。结构方程有效地整合了各种统计方法,可以实现复杂变量间的路径关系,尤其是多因变量的问题。可以认为这种技术是解决面的问题的一种特有的方法。1)先验理论性 SEM模型的“一边”是先验理论导出的协方差结构,“一边”是样

187.1009 8 1
  • 关注作者
  • 收藏
有福有德

核密度工作原理及实现

SAS的KDE过程实现核密度估计,功能及其说明如下:可以对单变量和双变量进行核密度估计,所谓的核(kernel)估计是一种非参数方法,是指从原始数据中观测到的概率密度函数(PDF)——平均的通过数据点,从而创建平滑曲线。 KDE过程使用高斯密度做为核,并假设其方差决定平滑的结果。 其工作原理:选择带宽(bandwith),进而核密度估计,但完成这些工作前提是完成数据的分箱

214.5274 12 7
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励

暂无数据