查询在sparksql上运行非常慢

ijnw1ujt  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(321)

我目前正在研究7个节点的集群,每个集群有16个内核,使用128gb内存。
我的配置如下:
在此处输入图像描述
我的一些带有连接的查询运行得非常慢,而且我正在处理数百万行的数据。。
编辑:查询包括联接。。选择a,b,c from(选择max(data\u mo\u dt)作为max\u date from m m\u frmly\u plan\u drug\u rstrctn\u temp)b inner join m\u frmly\u plan\u drug\u rstrctn\u temp a on 1=1,其中a.data\u mo\u dt>=add\u months(max\u date,-23)
有人能给我一些建议吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题