查询在sparksql上运行非常慢

ijnw1ujt 于 2021-06-02 发布在 Hadoop

关注(0)|答案(0)|浏览(321)

我目前正在研究7个节点的集群，每个集群有16个内核，使用128gb内存。
我的配置如下：
在此处输入图像描述
我的一些带有连接的查询运行得非常慢，而且我正在处理数百万行的数据。。
编辑：查询包括联接。。选择a，b，c from（选择max（data\u mo\u dt）作为max\u date from m m\u frmly\u plan\u drug\u rstrctn\u temp）b inner join m\u frmly\u plan\u drug\u rstrctn\u temp a on 1=1，其中a.data\u mo\u dt>=add\u months（max\u date，-23）
有人能给我一些建议吗？

hadoop yarn apache-spark apache-spark-sql

来源：https://stackoverflow.com/questions/36330673/queries-run-really-slow-on-sparksql

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

查询在sparksql上运行非常慢

暂无答案！

相关问题

热门标签

最新问答