我已经安装了一个R包,用于从tweet对象json文件(here is the github page)创建retweet级联。他们的代码使用他们的样本数据。下面是创建级联的两行代码:
filepath <- system.file('extdata', 'tweets_anonymized.jsonl', package = 'evently')
cascades <- parse_raw_tweets_to_cascades(filepath, progress = F)
Note-1:parse_raw_tweets_to_cascades
函数(在tweet.R
文件中)从给定的tweet对象jsonl文件创建级联。
**问题:**当我用我的数据运行它时(似乎具有相同的结构),它正确地从数据中提取信息(例如,tweet_id,retweet_id,user_id等),但它不会创建级联并显示此错误:
rep(1:nrow(index),cascade_sizes)中的错误:无效的“times”参数
显然,当第二个参数(cascade_sizes
)是负数或负数或变量向量时,会发生此错误。我尝试使用print(paste("Mona Cascade sizes is", cascade_sizes))
打印cascade_size,它返回以下内容:
“莫纳级联大小为”
**Note-2:**在此文件(processed_tweets <- data.table::as.data.table(data.table::rbindlist(processed_tweets_batch))
)的特定行之后,我看到以下问题:
*函数没有可见的全局函数定义:fwrite、:=和setorder
*全局变量无可见绑定变量:tweet_time、absolute_time、start_ind和end_ind
我已经读了五个类似的帖子,包括以下内容,但我无法修复我的错误:
- how to use utils::globalVariables
- ggplot2 inside R packages: Notes during CRAN tests
- How can I handle R CMD check "no visible binding for global variable" notes when my ggplot2 syntax is sensible?
UPDATE-1:
例如,我在tweet.R文件中添加了以下内容(这是在几个答案中建议的):
#' @import utils
utils::globalVariables(c("absolute_time", "start_ind", "end_ind"))
但我还是得到了同样的错误。
UPDATE-2:
我还将这些变量设置为NULL(如建议的here,但我仍然得到相同的错误。我在函数的顶部添加了以下行:
tweet_time <- end_ind <- start_ind <- absolute_time <- NULL
1条答案
按热度按时间lf3rwulv1#
我最近也遇到了类似的问题。以下是帮助:
. <- var1 <- var2 <- NULL
添加到我的函数中。在你的例子中,后面的点不见了。#' @import data.table
添加到函数的roxygen框架中,并执行document()
。这样一来,NAMESPACE文件就会得到更新,data.table也会得到正确的导入。