R语言之正则表达式-CDA数据分析师官网

热线电话：13121318867

登录

首页精彩阅读R语言之正则表达式

R语言之正则表达式

2017-02-16

收藏

R语言之正则表达式

正则表达式表通常被用来检索、替换那些符合某个模式(规则)的文本。在我看来，正则表达式的主要用途有两种：①查找特定的信息②查找并编辑特定的信息，也就是我们经常用的替换。。比如我们要在Word，记事本等里面使用快捷键Ctrl+F，进行查找一个特定的字符，或者替换一个字符，这就使用了正则表达式。

正则表达式的功能非常强大，尤其是在文本数据进行处理中显得更加突出。R中的grep、grepl、sub、gsub、regexpr、gregexpr等函数都使用正则表达式的规则进行匹配。这几个函数原型如下：

grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE,

fixed = FALSE, useBytes = FALSE, invert = FALSE)

grepl(pattern, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

sub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

gsub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

regexpr(pattern, text, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

gregexpr(pattern, text, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

regexec(pattern, text, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

这里是对参数进行一个解释说明。

接下来我们对这几个函数谈谈他们的不同点。

现在来举几个例子。

首先使用[]中括号的功能，来查找一下看有没有do组合的单词。

text<-c("Don't","aim","for","success","if","you","want","it","just","do","what","you","love",

"and","believe","in","and","it","will","come","naturally")

#查找含有DO组合的单词

grep("[Dd]o",text)#不区分大小写

grep("[D]o",text)#D要大写

grep("[d]o",text)#D小写

运行结果如下：

> text<-c("Don't","aim","for","success","if","you","want","it","just","do","what",

"you","love","and","believe","in","and","it","will","come","naturally")

> 数据分析培训

> #查找含有DO组合的单词

> grep("[Dd]o",text)#不区分大小写

[1] 1 10

> grep("[D]o",text)#D要大写

[1] 1

> grep("[d]o",text)#D小写

[1] 10

邮箱匹配：

#邮箱匹配：

text2<-c("704232753@qq.com is my email address.")

grepl("[0-9.*]+@[a-z.*].[a-z.*]",text2)

结果如下

> text2<-c("704232753@qq.com is my email address.")

> grepl("[0-9.*]+@[a-z.*].[a-z.*]",text2)

[1] TRUE

说明可以查找到了。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

正则表达式 R语言数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册