配置单元查询:sparksql中的直线接口

6rvt4ljy  于 2021-06-26  发布在  Hive
关注(0)|答案(3)|浏览(416)

直线脚本是连接spark/bin中的hiveserver2的一种方式。
我运行了如下的简单查询。

在输出中,我可以看到map reduce正在启动。
我只是想了解spark中直线特性的优点是什么,因为它遵循了传统的map-reduce执行框架?
我们可以在直线上使用spark rdd功能吗?
提前谢谢。

o3imoua4

o3imoua41#

直线不是Spark的一部分。
它只是一个hiveserver2客户端。
您可以启动sparkshell并在shell中执行查询,但这与beeline无关。直线与Spark无关。

i2loujxw

i2loujxw2#

这是一种方法。如果你不想使用mapreduce,你可以使用 TEZ 作为引擎,它在内存中的运行速度将比mr。

SET hive.execution.engine=tez;

但不能从beeline运行spark ifrom。这是一个连接到hiveserver2的独立应用程序。

wgeznvg7

wgeznvg73#

加上@mondaymokey说的话。直线不是Spark发动机的一部分。它只是一个连接到spark的thriftserver(jdbc服务器)的jdbc客户机。beeline为您提供了一个sql接口来与sparksql交互

相关问题