
sas正则式之prxparse. Prxmatch
今天分享的是我这几天用到的正则式的一个小总结,这部分的内容因为比较多,所以会分成几篇文章分享。
其实我们在做数据的过程中老是会听到别人说,r处理数据比sas好用,但是在我理解里,看你先接触那个软件,你都很熟悉r了,你还会再花两三年去写sas吗?所以学软件,只要学的精,其实都是共通的,r能做的文本清洗的,sas也可以。但是我不是说你就不要去学r,我自己也会学R,在工作中也需要结合使用。只是希望你们不要对sas有偏见,毕竟我深爱sas胜过男朋友。
话太多了哈,毕竟白羊座嘛。上代码:
options compress=yes;
data dd;
input string$40.;
datalines;
我始终都抢不到2017年1月25号的票啊
今天是2017年1月23号
现在时间是9点17分
其实我很想我的妈咪
;
run;
data ss;
set dd;
if _n_=1 then ret=prxparse("/\我/");
retain ret;
position=prxmatch(ret,string);
run;
结果图如下:
Prxparse这个函数不能单独使用,都是和其他正则函数一起结合使用的,这个结果就不用看ret了,运行是pdv层面的事,我就不多说,这里要关注的prxmatch函数返回的关键字的位置。
prxmatch(ret,string)
ret填入的是prxparse返回的一个逻辑数,即0和1,以上面的例子为例,假设prxparse在变量string中没有找到“我”这个词,那么返回的0,反之返回1.你问我为什么上面的结果ret中的值是1,那是因为ret记录的只是第一条观测的ret的值,这个变量你就直接不看就行了。但是你要记住prxmatch是怎么跑的。即ret在要那条观测判断为1时,prxmatch就执行,在string中“我”的位置并返回。这里中文占两个字符哈。
这是一个简单的例子,现在具体介绍下常用的一个关键字的表述。
例如:
1、 Prxparse(”/\d\d\d/”)寻找任意的三个数字,这里要注意的是关键字必须用{“//”}圈起来。
2、 Prxparse(”/\d+/”)寻找一个以上的数字,可以是1个也可以是100个
3、 Prxparse(”/\w\w\w* /”)寻找两个以及两个以上的字符然后以空格分隔,*号后面有个空格,你再多看几眼。譬如你要寻找屁屁 后者屁屁屁 你就可以这么写Prxparse(”/\屁\屁\屁* /”)
4、 Prxparse(”/\w\w? + /”)寻找一个或者两个字符以一个空格或者多个空格分隔。看清楚哈,?后面是有空格的哈。这个总结一下,就是字符多的用*号,空格和数字多个用+号。
5、 Prxparse(”/(\w\w) +(\d) +/”)寻找一个两个字符之间与一个数字相隔一个或者多个空格的字符。注意,在正则式中,空格也算的,所以写的时候要小心。那这里举个栗子,就是譬如 “我是屁屁 2 ”那么就会找到:“屁屁 2 ”。
现在列出经常用到的关键字返回的数据类型:
不准说你英文看不懂,我大学四级考了四年才过的人不也照样看了。看不看懂取决你愿不愿意看,难道从小学学到大学的英文都被狗吃了吗?数据分析师培训
看过关键字的表述,给出一些例子熟悉一些这些表述:
这是针对Prxparse函数的例子:
一下是针对prxmatch(返回string的位置)函数的例子:
现在来个现实生活中会碰到的问题。
寻找电话号码:
data ee;
input string$40.;
cards;
电话:(123)333-4444
两个电话:(800)234-2222 和 (908) 444-2344
没有电话
;
run;
data ww;
set ee;
if _n_=1 then ret=prxparse("/\(\d\d\d\) ?\d\d\d-\d{4}/");
retain ret;
position=prxmatch(ret,string);
run;
结果:
prxparse("/\(\d\d\d\) ?\d\d\d-\d{4}/");这条正则式的意思是:
匹配有括号里中3个数字,然后不知道有木有空格为间隔之后再接三个数字之后加一个横杠之后加4个数字。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Logic 模型特征与选择应用:构建项目规划与评估的逻辑框架 在项目管理、政策制定以及社会服务等领域,Logic 模型(逻辑模型 ...
2025-06-19SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的利器 在数据分析的众多方法中,Mann-Kendall(MK)检验凭借其对数据分 ...
2025-06-19CDA 数据分析能力与 AI 的一体化发展关系:重塑数据驱动未来 在数字化浪潮奔涌的当下,数据已然成为企业乃至整个社会发展进 ...
2025-06-19CDA 干货分享:统计学的应用 在数据驱动业务发展的时代浪潮中,统计学作为数据分析的核心基石,发挥着无可替代的关键作用。 ...
2025-06-18CDA 精益业务数据分析:解锁企业增长新密码 在数字化浪潮席卷全球的当下,数据已然成为企业最具价值的资产之一。如何精准地 ...
2025-06-18CDA 培训:开启数据分析师职业大门的钥匙 在大数据时代,数据分析师已成为各行业竞相争夺的关键人才。CDA(Certified Data ...
2025-06-18CDA 人才招聘市场分析:机遇与挑战并存 在数字化浪潮席卷各行业的当下,数据分析能力成为企业发展的核心竞争力之一,持有 C ...
2025-06-17CDA金融大数据案例分析:驱动行业变革的实践与启示 在金融行业加速数字化转型的当下,大数据技术已成为金融机构提升 ...
2025-06-17CDA干货:SPSS交叉列联表分析规范与应用指南 一、交叉列联表的基本概念 交叉列联表(Cross-tabulation)是一种用于展示两个或多 ...
2025-06-17TMT行业内审内控咨询顾问 1-2万 上班地址:朝阳门北大街8号富华大厦A座9层 岗位描述 1、为客户提供高质量的 ...
2025-06-16一文读懂 CDA 数据分析师证书考试全攻略 在数据行业蓬勃发展的今天,CDA 数据分析师证书成为众多从业者和求职者提升竞争力的重要 ...
2025-06-16数据分析师:数字时代的商业解码者 在数字经济蓬勃发展的今天,数据已成为企业乃至整个社会最宝贵的资产之一。无论是 ...
2025-06-16解锁数据分析师证书:开启数字化职业新篇 在数字化浪潮汹涌的当下,数据已成为驱动企业前行的关键要素。从市场趋势研判、用 ...
2025-06-16CDA 数据分析师证书含金量几何?一文为你讲清楚 在当今数字化时代,数据成为了企业决策和发展的重要依据。数据分析师这一职业 ...
2025-06-13CDA 数据分析师:数字化时代的关键人才 在当今数字化浪潮席卷全球的时代,数据已然成为驱动企业发展、推动行业变革的核心要素。 ...
2025-06-13CDA 数据分析师报考条件全解析 在大数据和人工智能时代,数据分析师成为了众多行业追捧的热门职业。CDA(Certified Data Analyst ...
2025-06-13“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23