我有一个包含字符串列的表。此列包含大量文本,但由于某些未知原因,我发现了一些nul字符,如"\0sult"。我希望清理我的列并删除此nul字符,但我不知道如何执行此操作。如果我尝试:
grepl(pattern = "\0", x = "blabla \0sults")
我有
Error in parse(text = x, srcfile = src): nul character not allowed (line 1)
我如何检测并删除这些nul字符?
ltqd579y1#
我怀疑(不管出于什么原因)你的表实际上没有nul字符,严格地说,字符串有字符“\”和“0”。为了匹配这两个字符,你必须对它进行双转义。例如,如果我有文件“data.csv”
key,value key1,blue key2,\0sults key3,blabla \0sults key4,brown
然后,您将像这样匹配字符对:
myData <- read.csv("data.csv") grepl(pattern = "\\\\0", myData$value) #> [1] FALSE TRUE TRUE FALSE
1条答案
按热度按时间ltqd579y1#
我怀疑(不管出于什么原因)你的表实际上没有nul字符,严格地说,字符串有字符“\”和“0”。为了匹配这两个字符,你必须对它进行双转义。
例如,如果我有文件“data.csv”
然后,您将像这样匹配字符对: