r:使用另一个xdf过滤一个xdf

2ic8powd  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(439)

我正在尝试使用 in 将其与另一个xdf文件(位于cloudera上)进行比较。
如果我尝试:

rxDataStep(inData = largeXdf,
       outFile = largeXdf,
       overwrite = TRUE,
       transformObjects = 
         list(param1 = parameter),
       rowSelection = (columnNameFromLargeXdf %in% param1$1),
       numRows = -1))

我得到一个关于 param$1 表示s4类的对象不能被子集。在xdf中,数据对象不能被子集。有什么办法吗?我不想将xdf转换成本地csv文件,因为它非常大。

r1zhe5dt

r1zhe5dt1#

XDFs 当然可以是子集,但不能覆盖 XDFhdfs . 您将需要写入另一个文件。还有,如果你这么说 parameter 也是一个 XDF 然后你在游戏中使用它的方式 rowSelection 不正确。

相关问题