select key, count(*) cnt
from table
group by key
having count(*)> 1000 --check also >1 for tables where it should not be duplication (like dimentions)
order by cnt desc limit 100;
``` `key` 可以是复杂联接键(联接条件中使用的所有列)。
也看看这个答案:https://stackoverflow.com/a/51061613/2700344
1条答案
按热度按时间mgdq6dx11#
说明计划对此没有帮助,你应该检查数据。如果它是一个连接,请从连接中涉及的所有表中选择前100个连接键值,如果它是分析函数,请对按键分区执行相同的操作,然后您将看到它是否是一个倾斜。
例子: