如何在pyspark中基于分隔符将二进制文件读入rdd并进行过滤?

gzszwxb4  于 2021-07-13  发布在  Spark
关注(0)|答案(0)|浏览(176)

我想把一个二进制文件读入rdd。正在读取以~分隔的二进制文件。我该怎么做?以及如何过滤结果rdd,比如抛出所有以\x10开头的64字节块?谢谢!我是Pypark的新手。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题