搜索此博客

2017年12月4日星期一

R 中文正则表达式

library(stringr)
word <- c("在线正则表达式测试")
pattern <- '^[\u4E00-\u9FA5]+$'
#返回了向量x中哪个元素匹配了模式pattern(即返回了向量x的某些下标)或者具体哪个元素匹配了模式(通过设置value参数来完成)
grep(pattern,word)
#检测字符是否存在某些指定模式
str_detect(word,pattern)
#向量word中的每个元素是否匹配了pattern,即只返回TRUE或FALSE
grepl(pattern, word)

#regexpr(),gregexpr()和regexec()函数同样也可用来进行字符串搜索

没有评论:

发表评论