詹惠儿

2018-11-19   阅读量: 727

数据分析师 大数据

正则表达式是什么?

扫码加入数据分析学习群

正则表达式的定义

正则表达式(又名正则表达式)是一组模式匹配命令,用于检测大型文本数据中的字符串序列。 这些命令旨在匹配文本的族(字母数字,数字,单词),这使得它具有足够的通用性来处理任何文本/字符串类。

简而言之,使用正则表达式可以在编写较短代码时获得更多文本数据。

例如,假设您从网上抓取了一些数据。 数据包含用户的日志时间。 您想要提取日志时间。 但是,数据很混乱。 在这种情况下,您应该使用正则表达式。

正则表达式怎么使用

一行正则表达式可以轻松替换几十行编程代码。正则表达式并不只限定在什么软件中使用,几乎所有脚本语言(例如Perl,Python,PHP和JavaScript)都支持Regex;以及Java等通用编程语言;甚至Word等文字处理器用于搜索文本。由于其很复杂的语法,开始使用正则表达式可能并不容易,但它肯定值得投入你的时间。

正则表达式通常由一对正斜杠/.../(或引号或其他用户定义的符号)分隔。它由一系列字符,元字符(如.\d\s,\S)和运算符(如+*?|^)组成。大多数字符(包括所有字母( azAZ )和数字( 0-9 ))都匹配。 例如,正则表达式/a/匹配单字符串"a" ; /x/匹配"x" ; 和/9/匹配"9"

没有特殊含义的特殊字符也与其匹配。 例如, /=/ matches "="为了匹配正则表达式中具有特殊含义的特殊字符,例如+ * / \ ( ) [ ] { }等等,我们需要在它后面添加一个反斜杠,称为转义序列。例如,/\+/匹配"+";/\[/匹配匹配"["

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子