登录
首页精彩阅读SAS SQL select…into语句创建宏变量巧妙解决问题的总结
SAS SQL select…into语句创建宏变量巧妙解决问题的总结
2017-03-29
收藏

SAS SQL select…into语句创建宏变量巧妙解决问题的总结

今在某SAS交流群看到这样一个问题如下:

有一个数据集a,有三个变量c,b,d(他们在数据集中的顺序也是如此),想新建一个变量var,并添加到b和d中间,怎么做?

我想的代码如下:

/*将原数据集变量名称存放在宏变量中*/

proc sql ;

select name into :names separated by ","

from dictionary.columns

where libname="SASHELP" and memname="CLASS";

quit;

%put &names;

/*解析宏变量,插入新变量名称,在放入宏变量*/

data test;

vars="&names";

vars_new=tranwrd(vars,"Sex","Sex,'newvar' astest");

call symput("new_names",vars_new);

run;

%put &new_names;

/*在原数据集中插入新变量*/

proc sql;

create table test as

select &new_names

from sashelp.class;

quit;

这个问题思路很简单,把原数据集变量组装如宏变量,再按要求修改,再组装到一个宏变量。在实际工作中可能基本不会遇到,如果遇到一般也是采用数据集间的横向合并去解决这个问题。

在这里想说的是,怎么巧妙运用SQL里select…into语句。如果你一直关注本公众号的文章,你会发现在最近的文章里都涉及到该语句的使用,一个文件夹下文件的批量导入、一个EXCEL工作薄中不规则sheet名称的批量导入,逻辑库多个数据集的批量导出、变量的批量处理,数据集的批量合并等等,都巧妙的应用了select…into..语句。

要巧妙运用该语句,有时还需要理解下SAS的dictionary table(字典数据表)的应用。首先需要字典数据表是什么,通过view字典数据表如下可知,通俗的说就是存放数据集基本信息的数据表,这个表包括存放列(columns)、存放数据集名称(memname)和存放数据集所在逻辑库名称(libname)的数据表。

1.查询数据集变量名称 ,如果要把某数据集的变量名称抽提出来就如上述例子;从dictionary.columns里查询name;

2.查询数据集名称 如果要对某逻辑库的不同数据集进行批量,就把该逻辑库的所有数据集名称放入宏变量。就从dictionary.tables.

proc sql;

select memname INTO :memnames

from dictionary.tables

where libname="WORK";

quit;

3.查询逻辑库名称  如果想对不同逻辑库进行操作,将逻辑库名称放入宏变量。

proc sql;

select distinct(libname) 

INTO:memnames separated by ","

from dictionary.tables;

quit;

注意的问题:

(1)以上查询也都可以在dictionary.indexes里查询,变量名称、数据集和逻辑库对应名称为name、memname和libname。

(2)变量名称、数据集和逻辑库名称存放形式均为严格的大写。如where libname="WORK";因此在查询时需注意大小写,如果小写需要upcase下。

(3)需要根据宏变量运用的场景选择不同的分隔符,如sas base模块中多个变量间不需要逗号隔开,这时宏变量变量名称存放时分隔符就该是空格,相反在SQL中多个变量并放时,需要逗号作为分隔符,这时需要逗号分隔名称等等,总之首先需要考虑宏变量的运用场景添加合适的分隔符分隔名称。

4.数据集变量数和观测数

proc sql;

select nobs,nvar into:nobs,:nvars

from dictionary.tables

where libname="WORK" and memname="TEST";

quit;

5.跨逻辑库数据集名称 从多个逻辑库里查询数据集,并批量导出。

/*不同逻辑库不同数据集*/

proc sql;

select  distinct trim(libname||"."|| memname)

into :libnames separated by " "

from dictionary.indexes;

quit;

%put &libnames;

综上,想怎么操作,就看你的解决问题的思路了。很简单,问题简单化,就是这么简单和任性。

理解了以上问题,在处理批量问题时其实是很简单的。请结合以前发的文章进行理解,当然还有很多别的应用,只要是能想到的,你能把它转化为sas能识别的语言,一切很简单。

1. 导入含有多个不规则EXCEL子表名称的数据 ——SAS+EXCLE合作更有效

2. SAS data步、SQL和宏解决多表(≥3)合并问题

3. 一段宏解决TOPSIS综合评价问题,写文章也就是批量生产的问题

4. Sas应用之解决多个文件数据资源的批量导入问题

5. Sas 数组、宏应用之批量更改变量类型。


SQL

数据分析咨询请扫描二维码

客服在线
立即咨询