我正在执行一个类似 select <column> from <mytable> where <partition_key> = <value> limit 10
而且要花很长时间才能执行。我看了实物图,看到一个 HiveTableScan
在那里和那看起来可疑,这是否意味着查询正在扫描整个表?我期待着这个问题
答。只扫描一个分区
b。返回10行后立即结束扫描
我的理解有误吗?我怎样才能让spark做到这一点?
我正在执行一个类似 select <column> from <mytable> where <partition_key> = <value> limit 10
而且要花很长时间才能执行。我看了实物图,看到一个 HiveTableScan
在那里和那看起来可疑,这是否意味着查询正在扫描整个表?我期待着这个问题
答。只扫描一个分区
b。返回10行后立即结束扫描
我的理解有误吗?我怎样才能让spark做到这一点?
暂无答案!
目前还没有任何答案,快来回答吧!