select top 1*from c返回count size as num of partitions*cosmosdb spark中的实际查询计数

czq61nw1  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(300)

我正在使用 azure-cosmosdb-spark 我和scala的库试图查询以下内容

select top 1 * from c

但我得到的最终Dataframe计数是8而不是1。我怀疑 CosmosDBRDDIterator 将其拆分为多个分区(在本例中为8)并处理查询。
结果计数将始终是实际结果计数的8倍,无论执行的select查询是什么。
有没有什么办法可以避免这一点,让我的实际计数为1?
谢谢你的建议

shstlldc

shstlldc1#

尝试 limit 而不是 top ? select * from c limit 1

相关问题