我正在尝试使用 in
将其与另一个xdf文件(位于cloudera上)进行比较。
如果我尝试:
rxDataStep(inData = largeXdf,
outFile = largeXdf,
overwrite = TRUE,
transformObjects =
list(param1 = parameter),
rowSelection = (columnNameFromLargeXdf %in% param1$1),
numRows = -1))
我得到一个关于 param$1
表示s4类的对象不能被子集。在xdf中,数据对象不能被子集。有什么办法吗?我不想将xdf转换成本地csv文件,因为它非常大。
1条答案
按热度按时间r1zhe5dt1#
XDFs
当然可以是子集,但不能覆盖XDF
在hdfs
. 您将需要写入另一个文件。还有,如果你这么说parameter
也是一个XDF
然后你在游戏中使用它的方式rowSelection
不正确。