在spark上打印查询配置单元的物理计划

nom7f22z 于 2021-06-24 发布在 Hive

关注(0)|答案(1)|浏览(418)

我使用hive2.3.7和spark-2.0.0作为执行引擎。我想知道如何打印物理计划，以查看caclcite选择在查询上执行哪个连接算法。

Hive

来源：https://stackoverflow.com/questions/65076321/print-physical-plan-of-query-hive-on-spark

1条答案

按热度按时间

xwmevbvl1#

你可以用 explain .
在Pypark中：

df = df1.join(df2, 'id')
df.explain()

在spark sql/hive ql中：

EXPLAIN SELECT * FROM table1 JOIN table2 ON table1.id = table2.id;

有关详细信息，请参阅
http://spark.apache.org/docs/latest/sql-ref-syntax-qry-explain.html
https://cwiki.apache.org/confluence/display/hive/languagemanual+explain

赞(0）回复(0）举报 2021-06-24

我来回答

在spark上打印查询配置单元的物理计划

1条答案

相关问题

热门标签

最新问答