
sas基础_sas知识_sas基础知识_数据分析师
Ⅳ.用在 DATA 步的信息语句 1.ARRAY 语句(数组语句) (1)显示下标数组语句 格式为∶ARRAY 数组名 [{n}] [$] [数组元素的长度] [数组元素] [(初始值)]; 注意∶数组名不能与同一 DATA 步中的 SAS 变量同名。{n}表示数组元素的个数,是正 整数 或*号,括号可用{}、[]或()。$表示数组的元素是字符。如∶ ARRAY rain{5} x1-x5; ARRAY ab(*) x y z; ARRAY c[3]; ARRAY d(10) _TEMPORARY_; _TEMPORARY_表示创建临时数组元素列表,其特点为∶ ①它们没有名字,引用时必须用数组名和下标,如∶d(5); ②不能出现在输出的数据集 上。 ③不能用特殊下标(*)来引用所有元素。④计算速度快,占用内存少。 (2)隐含下标数组语句 格式为∶ARRAY 数组名 [(下标变量)] [$] [数组元素的长度] [数组元素]; 如∶ DATA one; INPUT id x1-x10 y1-y10; ARRAY big(i) x1-x10 y1-y10; i=11; PUT big; CARDS; (数据行) DATA two; INPUT id x1-x10 y1-y10; ARRAY big(i) x1-x10 y1-y10; DO OVER big; IF big=. THEN big=0; END; CARDS; (数据行)
; ; 左边程序中 PUT 语句输出 big 的第 11 个元素的值;右边程序把 big 中的所有缺失值改 为0。 2.INFORMAT 语句(输入格式语句) 格式为∶INFORMAT 变量名 [输入格式] [DEFAULT=规定临时缺省的输入格式]……; 在 DATA 步,可用此语句来规定在 INPUT 语句中列出的变量的省略输入格式。如∶ DATA _null_; CARDS; INFORMAT DEFAULT=3.1; 11 22 33 44 55 INPUT x1-x5; ; PUT x1-x5; RUN; 这个 DATA 步提交后在 LOG 窗口输出的结果为∶1.1 2.2 3.3 4.4 5.5。 3.FORMAT 语句(格式语句) 格式为∶FORMAT 变量名 [格式] [DEFAULT=规定临时缺省的输入格式]……; 在 DATA 步使用 FORMAT 语句可永久地把格式同变量联系起来, PROC 步用 FORMAT 在 语句仅仅 在 PROC 步起作用。SAS 系统将使用联系的格式来输出这些变量的值。如∶ DATA _null_; PROC FORMAT; FORMAT y 10.3 DEFAULT=8.2; VALUE sexfmt 1='MALE' x=12.1; y=10.3; 2='FEMALE'; PUT x=; DATA all; CARDS; Jane 2 Bill 1 …… ;
PUT y=; INPUT name $ sex @@; RUN; RUN; FORMAT sex sexfmt.; (程序1) (程序2第1部分) (程序2第2部分) 程序1的输出结果为∶x=12.10 y=10.300; 程序2中性别 sex 输入时用1(男)、 2(女), 输出时自动变成 MALE(男)、FEMALE(女)。 4.LENGHT 语句(长度语句) 格式为∶LENGHT [变量名][$]长度]……[DEFAULT=n]; 在 DATA 步用该语句规定在开始创建的每个数据集中 SAS 系统用来存贮变量值的字节 数目。 如∶LENGHT name $20; 设置字符变量 name 的长度为 20。 字符变量的长度在1到 200 之间;数 值变量的长度在3到8之间。 5.LABEL 语句(标记语句) 格式为∶LABEL 变量名='标记内容,包括空格最多 40 个字符'; 如∶ LABEL compound='TYPE OF PRUG'; LABEL n='SAMPLE SIZE'; 6.ATTRIB 语句(属性语句) 格式为∶ATTRI
B 变量名 [FORMAT=格式] [INFORMAT=输入格式] [LABEL='标记内容 '] [LENGHT=[$]长度]……; 如∶ ATTIB x LENGHT=$4 LABEL='TEST VARIABLE'; ATTIB saleday INFORMAT=mmddyy. FORMAT=worddate.; 7.语句标号(参见 GOTO 语句和 LINK 语句) 8.DROP 语句(删除语句) 格式为∶DROP 变量名; 在 DATA 步中使用 DROP 语句来规定不包含在这个 SAS 数据集或正被创建的数据集中 的变量。 当有多个数据集正被创建时,为了有选择地删掉变量, 在每个数据集的名字后面使用 DROP= 的数据集选择项(参见 DATA 语句)。 9.KEEP 语句(保存语句) 格式为∶KEEP 变量名; 与 DROP 语句用法相同,作用相反。 10.RETAIN 语句(保留语句) 格式为∶RETAIN [元素……[初始值|(初始值][,]……)]……]; 元素可以是变量、变量列表或数组名,它们的值是用户想保留的。如果没有列出元素, SAS 保留 DATA 步中所有变量值。 用 INPUT 语句或赋值语句,再使用 RETAIN 语句时,仅仅在 DATA 步第1次重复执行 之前, SAS 置这些变量为缺失(或 RETAIN 语句中给出的初值); 以后,变量保持它们的值直 到新的值 成为有效(如通过赋值语句或 INPUT 语句的下一次执行)。 在 RETAIN 语句中命名累加 的唯一目 的是给郴等于0的其他初值(不用此语句变量的初值为0)。 11.RENAME 语句(换名语句) 格式为∶RENAME 旧变量名=新变量名……;数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29