我想把一个二进制文件读入rdd。正在读取以~分隔的二进制文件。我该怎么做?以及如何过滤结果rdd,比如抛出所有以\x10开头的64字节块?谢谢!我是Pypark的新手。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!