我有一个数据集,其中参数和数字串在引号(')中。我想首先将整个文本与数字分开。然后通过去掉引号来清理它。
df <- data.frame( test = c("'+ test1 0.0553933412'", "'<All variables> 0.0553799779'", "'+ test3 0.0009441928'",
"'<none> 0.0000000000'","'+ test2 -0.0012808645'"))
我尝试了下面的方法,问题是带有text 1、2和3的数字也被分开了,我还想去掉这两列中的+和
编辑:多亏了@GregorThomas,我才能把它们分成行。我还想去掉两列中的+、〈、〉和
library(tidyr)
df <- df %>%
separate(test,
into = c("text", "num"),
sep = c(" {2,}")
)
2条答案
按热度按时间n3schb8v1#
更新:利用可以拆分至少有两个空格的列这一事实,可以重写为:
创建于2023年3月8日,使用reprex v2.0.2
nbysray52#
或者,您可以使用
mutate_all
在所有列中进行修剪(去除符号)。在这种情况下,您的代码将是: