我有一个以\n1.
或\ntext
开头的字符串向量,我希望过滤所有以\n1.
开头的字符串样本:
[1] "\n1. Morgenhanen matter"
[2] "\n1. Morgenstund har guld"
[3] "\nMorgensange for børn be"
但我似乎无法理解那些以\n1开头的句子。我现在的情况是:
grepl("^['\\\\']n1", df$text)
但它对所有句子都返回false ...
最后我想得到这样的结果
library(tidyverse)
df %>%
filter(those sentences starting with \n1)
对不起,我不是最好的正则表达式在r.
2条答案
按热度按时间6qftjkof1#
您可以:
输出量:
数据类型
c3frrgcw2#
请注意,字符串中的
\n
是一个换行符\x0A
。^
-字符串开始['\\\\']
-一个'
或\
字符n1
-一个n1
字符串。因此,如您所见,您的模式与换行符不匹配。
您可以使用
请参阅R demo:
输出量:
这里,
"^\\n1"
是^\n1
正则表达式模式,它匹配^
-字符串开始\n
-换行1
-一个1
字符