我正在使用 azure-cosmosdb-spark
我和scala的库试图查询以下内容
select top 1 * from c
但我得到的最终Dataframe计数是8而不是1。我怀疑 CosmosDBRDDIterator
将其拆分为多个分区(在本例中为8)并处理查询。
结果计数将始终是实际结果计数的8倍,无论执行的select查询是什么。
有没有什么办法可以避免这一点,让我的实际计数为1?
谢谢你的建议
我正在使用 azure-cosmosdb-spark
我和scala的库试图查询以下内容
select top 1 * from c
但我得到的最终Dataframe计数是8而不是1。我怀疑 CosmosDBRDDIterator
将其拆分为多个分区(在本例中为8)并处理查询。
结果计数将始终是实际结果计数的8倍,无论执行的select查询是什么。
有没有什么办法可以避免这一点,让我的实际计数为1?
谢谢你的建议
1条答案
按热度按时间shstlldc1#
尝试
limit
而不是top
?select * from c limit 1