Spark桶数据检索

eaf3rand 于 2021-07-12 发布在 Spark

关注(0)|答案(0)|浏览(267)

因此，如果我使用partition by来保存spark表中的数据，我们知道哪个分区是我们的数据（比如国家名称和州），所以当我们写where子句时，通过提到国家名称和州，它将从那里去获取数据
所以这样它限制了访问并直接搜索关键字，但是如果我们想做bucketing作为分区，那么对于惟一值来说就太多了
因此，我们将使用bucket的数量，后跟列名。
但是，当我们想从bucked数据中获取数据时，成本不会很高，因为我们不知道数据的实际位置，它最终会遍历整个bucket区域
请解释一下

apache-spark apache-spark-sql partitioning bigdata

来源：https://stackoverflow.com/questions/66572201/data-retrieval-from-spark-bucket

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

Spark桶数据检索

暂无答案！

相关问题

热门标签

最新问答