R中的字符串操作到标识模式

kpbwa7wx  于 2023-05-04  发布在  其他
关注(0)|答案(1)|浏览(83)

我试图在字符串列表中找到模式。
| 弦|预期字符串(预期结果)|
| --------------|--------------|
| #string-string-string-string-9999-9999|#string-9999|
| 电话:+86 -021 - 89999999|#string-9999|
| #string-9999|#string-9999|
| #string-9999-string|#string-9999-string|
| #string-string-string-string-9999-9999-string|#string-9999-string|
在这里(“预期字符串”列),我试图减少字符串的连续字母和数字部分以识别模式。有人能帮我吗?
我使用了bpa库,但没有达到预期的结果。

s6fujrry

s6fujrry1#

使用正则表达式模式“\B(\w+)(-\1)+\b”匹配由连字符(-)分隔的连续重复单词:

x <- c(
  "#string-string-string-string-9999-9999",
  "#string-string-9999-9999-9999",
  "#string-9999",
  "#string-9999-string",
  "#string-string-string-string-9999-9999-string"
)

gsub("\\b(\\w+)(-\\1)+\\b", "\\1", x, perl = TRUE)

相关问题