詹惠儿

2018-11-19   阅读量: 686

数据分析师 大数据 R语言 Python编程

什么是字符串操作?

扫码加入数据分析学习群

字符串操作的定义

顾名思义,字符串操作包含一系列用于从文本变量中提取信息的函数。 在机器学习中,这些功能被广泛用于进行特征工程,即从现有的字符串特征创建新特征。 在R中,我们有像stringr and stringi这样的包,它们都加载了所有的字符串操作函数。

此外,R还包括几个用于字符串操作的基本函数。 这些函数旨在补充正则表达式。 字符串操作函数和正则表达式之间的实际差异是

  1. 我们使用字符串操作函数来执行简单的任务,例如拆分字符串,提取前三个字母等。我们使用正则表达式执行更复杂的任务,例如从一组文本中提取电子邮件ID或日期。
  2. 字符串操作函数旨在以某种方式响应。 他们不偏离自然行为。 然而,我们可以以任何我们想要的方式自定义正则表达式。

例如,假设您获得了一个数据集,其中包含name of the customer作为变量。 在这种情况下,我们可以使用字符串操作函数来提取和创建新功能作为名字和姓氏。 从下一节开始,我们将实际学习字符串操作函数和命令。 因此,请确保已在机器中安装了R。 此外,您应该安装stringr R包

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子