如何从R中的以下字符串中提取数字/ ID?
link <- "D:/temp/sample_data/0000098618-13-000011.htm"
我想提取 0000098618-13-000011
那是丢弃.htm和D:/temp/sample_data/。
我没有太多运气试过grep和gsub。
解决办法:使用basename后跟sub:
sub("\\..*", "", basename(link))
## [1] "0000098618-13-000011"
要么
library(tools)
file_path_sans_ext(link)
## [1] "0000098618-13-000011"
或者以更复杂的模式为代价,我们可以在一个单独的模式中完成sub:
sub(".*/(.*)\\..*", "\\1", link)
## [1] "0000098618-13-000011"
或单个gsub:
gsub(".*/|\\.[^.]*$", "", link)
## [1] "0000098618-13-000011"
或者strsplit:
sapply(strsplit(link, "[/.]"), function(x) tail(x, 2)[1])
## [1] "0000098618-13-000011"
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar