SAS之大话PDV-CDA数据分析师官网

热线电话：13121318867

登录

首页精彩阅读SAS之大话PDV

SAS之大话PDV

2017-05-23

收藏

SAS之大话PDV

之所以说是数据源，而非输入缓冲区的原因上一条推送已经说明，这里就不再啰嗦啦。

这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。

IF语句 & WHERE语句

这两个语句均是用于条件选择，但二者作用时机却大有不同。简单来说，if语句作用于观测出PDV到生成数据集时；而where语句则作用于观测进入PDV之时。这也奠定了二者效率上的差别。由于where语句作用于观测进入PDV之时，SAS读入的观测已经过选择，读入观测数较少，所以在读入较大数据之时，where语句的优势就尤为明显了。

但又是因为where语句作用于观测进入PDV之时，也带来了一些限制，如：

当提交如上语句之时，SAS将会报错：

ERROR: 变量 x 不在文件“WORK.B”中。

而使用if语句则不会出现此ERROR。

对于这些选项的作用，相信大家也都有所了解；如不了解，那就得好好补补基础咯

言归正传，对于这些语句的作用时机，就不再一一演示，简单来说，rename、keep、drop语句用于PDV到生成数据集的过程中。而对于选项，则需看选项的位置：

对于上述代码，大家可自行敲击运行，就会发现在数据集b生成过程中出现NOTE: 变量 age 未初始化。原因就在于当选项用于set语句时，作用时机为原始数据至PDV之间；而当选项用于data语句时，则作用于PDV至生成数据集之间。

当SASDATA步中使用SET语句、MERGE语句和UPDATE语句读入变量时（除赋值语句和input语句外），SAS将会自动retain，即由这些语句读入的变量将不会被置缺失。

不多说，上例子：

例1：merge

结果：

运行过程：

从a读入第1条观测，从b读入第1条观测，查看id(即by变量)是否匹配，若不匹配，则读入id较小的观测，若匹配则一起读入PDV。此例为匹配。

到达RUN语句，将PDV写入数据集

从a、b分别读入第2条观测，检查发现不匹配。检查id是否与PDV中相同，若是，则读入匹配的观测（即a中第二条观测），若都不同，则将较小的id观测读入。

达到run语句，OUTPUT；

读入a的第3条观测，b的第2条观测，检查发现不匹配。再检查id发现a中第3条与PDV中id匹配，将其写入。后output。

读入a的第4条观测，b的第2条观测，检查发现匹配，再检查发现与PDV中id不同；此时进入另一个by组，初始化DVP。将匹配的观测写入DVP。

读入a中第5条观测，b中第3条观测，发现id不匹配，再检查发现b中第3条观测id与PDV中id匹配，将其读入，后output。

读入a中第5条观测，b中第4条观测，发现id匹配并与PDV中id不同，初始化pdv，将两条观测整合写入PDV，后output。

由于a中观测已读完（EOF），读入b中第5条观测，发现与PDV中id不同，初始化PDV，读入b中第5条观测，output。注意此时由于没有匹配，且为新的by组，不存在retain的x变量，所以最后一条观测中x为空。

a、b数据集均到达EOF，程序运行结束，保存数据集。

例2：set

结果：

这时候大家可能会发现，第二条观测不是同一个by组吗？为什么第2条观测的x变量不是第一条中x的值呢？为什么没有retain？

然而，其实还是有retain的，只不过数据集中体现不出来，而结果为什么会是那样呢？这就涉及到PDV的又一个原则，当PDV从一个新的数据集中读入观测时，会将PDV置缺失。

若你想看出retain的效果呢，有个办法：

对于UPDATA等其他语句，就不再举例啦，有兴趣者可自行探索。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册