京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一.使用PRINT过程步
1.PRINT过程步的基本使用
前面我们已经提到过利用PRINT过程步检查我们建立的SAS数据集的内容,实际上就是用PRINT过程步显示SAS数据集的内容。PRINT过程步由一个PROC PRINT语句开始,其一般形式为:
PROC PRINT options;

选项包括DATA=选项,它指定你使用的数据集,如果不使用该选项的话,系统使用最近用到的数据集。另外,在用PRINT过程步显示SAS数据集的内容之前,或者说,在一个程序的开头,往往需要用LIBNAME语句指定SAS数据库。例如:
libname clinic'c:\clinic';
proc printdata=clinic.admit;
run;
提交这段程序以后,SAS系统就会在OUTPUT窗口中显示该数据集的内容,我们把它称为报表(report)。例如:
|
ID |
NAME |
SEX |
AGE |
HEIGHT |
WEIGHT |
FEE |
|
2458 |
Murray, W |
M |
27 |
72 |
168 |
85.20 |
|
2462 |
Almers, C |
F |
34 |
66 |
152 |
124.80 |
|
2501 |
Bonaventure, T |
F |
31 |
61 |
123 |
149.75 |
2.控制产生的报表
在缺省情况下,PRINT过程步产生的报表会显示:
A.数据集中所有的观测和变量
B.在最左边一列显示观测号
C.变量根据它们在数据集中的顺序排列
为了得到你想要的报表,你可以对产生报表的过程进行控制,你可以:
A.利用系统选项控制报表的样式
B.选择显示变量和观测
C.对数据进行排序
D.加题注和尾注
E.显示描述性的变量标记
F.对数据规定格式
下面我们一一介绍如何进行控制。
3.设定系统选项
在你用PRINT过程步产生报表之前,你可以先设定一些系统选项控制报表的样式,包括:
|
选项 |
功能 |
|
LINESIZE= |
设定每行的长度 |
|
PAGESIZE= |
设定每页的行数 |
|
NUMBER|NONUMBER |
设定是否显示页码 |
|
PAGENO= |
设定开始页码 |
|
DATE|NODATE |
设定是否显示日期和时间 |
每一个系统选项都有缺省设置,例如,在缺省情况下,会自动显示页码。
你可以用以下任一方法改变这些系统选项:
1)用OPTIONS语句
一般形式为: OPTIONS options;
例如: options pagesize=20linesize=76;
options numberpageno=1;
OPTIONS语句可以出现在SAS程序的任意地方,从语句被执行的地方开始,设定的系统选项起作用,一直到你改变它的设置。
例如: options nonumber nodate;
proc printdata=sales.qtr3;
proc printdata=sales.qtr4;
options date;
run;
则在显示SALES.QTR3的时候页码和日期时间均不显示,而在显示SALES.QTR4的时候页码不显示但日期时间显示。注意,SAS系统要遇到DATA、PROC或RUN等关键词的时候才执行会执行前面一个程序步,因此,OPTIONS语句要遇到其后的这些关键词时才会被执行,但它会在其所属的程序步中优先执行。
2)用OPTIONS窗口
另一个改变系统选项的简单方法是进入OPTIONS窗口:
选择: Globals à Options àGlobal Options
找到想要设定的选项,作相应的改变即可。
4.NOOBS选项
你可以在PROC PRINT语句中使用NOOBS选项去掉报表中的观测号列。例如:
proc printdata=sales.qtr4 noobs;
run;
事实上,PROC PRINT语句中可以使用的选项很多,详细情况可利用HELP窗口查找:
Help à SAS System àREPORT WRITING àPRINT
5.选择变量
如果你的数据集中有很多变量,而你只希望显示其中的一部分,你可以在PRINT过程步中用VAR语句指定要显示的变量。其一般形式为:
VAR variables;
例如: var age height weight fee;
输出报表中的变量按照在VAR语句中出现的顺序排列。
注意,变量之间用空格分开。
6.选择观测
如果你只需要显示数据集中的某一部分观测,而不是所有的观测,你可以在PRINT过程步中用WHERE语句设定要显示的观测应满足的条件。
1)WHERE语句的一般形式为:
WHEREwhere-expression;
条件表达式的写法同第三章中所述相类似。例如:
whereweight<175;
where name='Almers,C';
注意,对字符型变量,条件表达式中的数据值用单引号括起,并且区分大小写。
2)复合条件
你也可以在多个条件的基础上选择你要显示的观测,这时候你可以在条件表达式中用AND(&)和OR(|)算符,例如:
where age<=55and weight >160; whereage<=55 & weight >160;
where fee=124.80 orfee=178.20; where fee=124.80 |fee=178.20;
3)IN算符
如果对同一个变量用多个值进行条件检验的话,可在条件表达式中用IN算符,例如:
where fee in(124.80,178.20);
4)多重复合条件
当你在条件表达式中用到一个以上AND(&)和OR(|)算符时,应该用括号来决定那些条件先复合,再与其它条件复合,例如:
where (age<=55and weight >160) or height >70;
where age<=55and (weight >160 or height >70);
显然是两个不同的条件。如果不加括号,则照前两个先复合的方法进行。
7.对数字型变量求和
你可以利用SUM语句对数字型变量求和,在输出的报表中,该变量所在列的最下方显示这一列数值的和。SUM语句的一般形式为:
SUM variables;
例如: proc print data=vcrsales;
varsalesrep region;
sumunitcost unit sold;
run;
在SUM语句中出现的变量名不需要在VAR语句中指定,也会在输出报表中显示。
8.对数据进行排序
如果你希望在报表中的观测是按照指定的顺序排列的话,就应当在利用PRINT过程步创建报表之前,用SORT过程步对数据进行排序。一个简单的SORT过程步的一般形式为:
PROC SORTDATA=SAS-data-set OUT=SAS-data-set;
BY variables;
RUN;
过程步以PROC SORT语句开始,其中,DATA=选项指明要读的数据集,BY语句是SORT过程步所必需的,它指明要按照哪个(那些)变量的值来进行排序。
OUT=选项指定一个输出数据集,在这个数据集中,所有的观测按指定的顺序排列。注意,如果不使用OUT=选项的话,在DATA=选项中指明的数据集就会被永久性地改变,而如果你只是希望它临时改变的话,就必须用OUT=选项指定一个临时的输出数据集。
9.题注(Titles)和尾注(Footnotes)
在SAS报表中,可以出现题注和尾注,题注出现在每一页的顶部,尾注出现在每一页的底部,如果没有定义,缺省的题注是‘The SAS System’,尾注不定义就不出现。
1)显示题注(Titles)
你可以改变输出报表中的题注,方法有:
A.用TITLES窗口
选择Globals à OptionsàTitles
进入TITLES窗口,在相应位置输入你希望作为题注的文字,
选择Edit à End
退出即可。
SAS系统允许有10个题注。
B.用TITLE语句
在产生报表的过程步中或之前用TITLE语句设定题注,其一般形式为:
TITLEn 'titletext';
例如: title1 'July Report';
title3 'group1';
用TITLE语句同样可以设定10个题注。
2)显示尾注(Footnotes)
你还可以改变输出报表中的尾注,方法与改变题注的方法相似:
A.用FOOTNOTES窗口
选择Globals à OptionsàFootnotes
进入FOOTNOTES窗口,在相应位置输入你希望作为尾注的文字,
选择Edit à End
退出即可。
SAS系统允许有10个尾注。
B.用FOOTNOOT语句
在产生报表的过程步中或之前用FOOTNOTE语句设定尾注,其一般形式为:
FOOTNOTEn 'footnotetext';
例如: footnote1 'PrepareedJuly 15';
footnote3 'byfinancial department';
用FOOTNOTE语句同样可以设定10个尾注。
3)改变题注和尾注的设定
题注和尾注的设定都是全局性的,设定以后,它们的作用一直延续到你重新设定或退出SAS系统。在设定了题注和尾注之后,你如果希望改变或取消这些设定的话,可用以下方法:
A.用TITLES 或FOOTNOTES窗口
进入TITLES 或FOOTNOTES窗口,改变或取消其中的设置。
B.用TITLE 或FOOTNOTE语句
用新的TITLE 或FOOTNOTE语句重新设定题注或尾注,新的设定会取代老的设定。
注意,新的TITLE 或FOOTNOTE语句被执行是,除了取代原先同样号码的题注或尾注之外,还会取消更大号码的题注或尾注。
用下列不加号码或不加文字的语句可取消所有的题注或尾注:
title1;
footnote;
10. 给变量设定描述性标记
如果某些变量名不足以表达该变量数据的性质,你希望在报表中以更准确的词句来作为这些列的标记的话,可以在过程步中使用LABEL语句,其一般形式为:
LABEL variable1='label'
Variable2='label';
标记可长达40个字符,并且,必须用引号括起。
你可以用一个LABEL语句,也可以用多个LABEL语句来设定描述性标记。
另外,为了显示标记,在PROC PRINT语句中必须使用LABEL选项。例如:
proc printdata=clinic.therapy label;
var month wjr;
labelwjr='Walk/Jog/Run';
run;
11. 设定输出数据的格式
你可以利用FORMAT语句设定变量的输出格式,以使报表看上去更完美。FORMAT语句的一般形式为:
FORMAT variableformat-name;
例如: format net comma5.0 grosscomma8.2;
format netcommiss dollar9.2;
在某一个过程步中的FORMAT语句设定的输出数据的格式,仅在同一个过程步产生的报表中起作用。
SAS系统提供许多输出格式,可用于在FORMAT语句中使用。你可以在SAS的HELP穿口中找到所有 的SAS输出格式,方法为:
Help à SAS System à SASLANGUAGE à SASFormats and Infortmats
下面是部分常用格式:
|
格式 |
例 |
显示结果 |
|
COMMAw.d |
Comma8.2 |
1,123.20 |
|
DOLLARw.d |
Dollar6.2 |
$56.00 |
|
MMDDYYw. |
Mmddyy6. |
150599 |
|
w.d |
8.2 |
12203.90 |
12. 自定义输出格式
在SAS系统中,用户还可以用FORMAT过程自己定义输出格式,其一般形式为:
PROC FORMAT;
VALUEformat-name range1='label'
range2='label';
例如: proc format;
value$destfmt 'LON'='London'
'PAR'='Paris'
'HON'='Hongkong';
run;
然后在PRINT过程中的FORMAT语句中就可以自定义的输出格式了,例如:
(接上例) proc print data=summer;
vardate dest;
formatdata date7. Dest $destfmt;
run;
二.使用TABULATE过程步
使用PRINT过程步你可以以列表的形式显示数据集的内容,但有时候你可能更希望以表格的形式对数据集中的内容进行分析,这时候,就可以利用TABULATE过程步来帮助你进行这项工作。
1.用TABULATE过程步创建表格
事实上,TABULATE过程步并不是简单地显示数据集的内容,而是对数据集中的内容进行归纳统计以后,根据用户的要求,制作各式表格供用户分析使用。
TABULATE过程步能帮助你方便地设计你的报表,你可以自由决定表格的形式和结构,作出的表格可以是一维的、二维的或三维的。同时,TABULATE过程步能对数据集中的数据进行归纳统计,在表格中显示一些描述性统计量,例如:
A.SUM(和)
B.MEAN(均值)
C.MINIMUM(最小值)
D.MAXIMUM(最大值)
F.VARIANCE(方差)
等等。
你也可以在TABULATE过程步中进行选择观测、设定描述性标记、设定题注和尾注、给数据规定输出格式等操作。
2.设计表格
使用TABULATE过程步的关键是计划,与PRINT过程步不同,TABULATE过程步不会产生缺省的报表,你必须告诉它如何创建表格,因此,在使用TABULATE过程步之前,最好先画一个草表,以明确你自己到底想要得到一个什么样的表格。具体说,你需要决定:
A.使用什么数据
B.用什么变量对数据分类
C.对什么变量进行分析
D.表格的形式
3.基本的TABULATE过程步
一个简单的TABULATE过程步包含以下四条基本语句:
|
语句 |
功能 |
|
PROC TABULATE |
启动过程步,设定数据集 |
|
CLASS |
设定分类变量 |
|
VAR |
设定分析变量 |
|
TABLE |
描述产生的表格 |
其中,PROC TABULATE语句作为TABULATE过程步的开头,是必须要有的,其一般形式为:
PROC TABULATEoptions;
例如: proc tabulatedata=clinic.admit;
其中,DATA=选项决定使用什么数据集。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05