“spark模式上的配置单元”和“spark sql”有什么区别?“Hive点火模式”会使用catalyst optimizer吗?

nlejzf6q  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(260)

Hive点火模式与mr模式
Sparksql
催化剂优化器/rdd/钨

bvpmtnay

bvpmtnay1#

spark上的配置单元不同于通过hivecontext使用spark sql运行配置单元查询。它不将查询转换为spark原语,而是将它们转换为mapreduce原语并在spark上执行。它的主要目的是利用spark执行引擎,而不影响hive中现有的代码。
在内部,它将hive的逻辑运算符转换为spark任务,这些任务主要是rdd转换和操作,目前还没有使用dataframe(根据官方文档),因此它没有使用wongth或catalyst optimizer来完成这些任务。
以下文件提到了官方文件中提供的spark上Hive的所有设计考虑因素-
Hive点火模式设计

相关问题