顾名思义,字符串操作包含一系列用于从文本变量中提取信息的函数。 在机器学习中,这些功能被广泛用于进行特征工程,即从现有的字符串特征创建新特征。 在R中,我们有像stringr and
stringi
这样的包,它们都加载了所有的字符串操作函数。
此外,R还包括几个用于字符串操作的基本函数。 这些函数旨在补充正则表达式。 字符串操作函数和正则表达式之间的实际差异是
例如,假设您获得了一个数据集,其中包含name of the customer
作为变量。 在这种情况下,我们可以使用字符串操作函数来提取和创建新功能作为名字和姓氏。 从下一节开始,我们将实际学习字符串操作函数和命令。 因此,请确保已在机器中安装了R。 此外,您应该安装stringr R包 。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar