我正在尝试使用amazonemr运行一个配置单元查询,并试图让apachetez也使用它,据我所知,这需要设置 hive.execution.engine
属性到 tez
根据Hive网站?
我知道可以用 set hive.{...}
通常,或者在 hive-site.xml
,但我不知道这两个在amazon emr中是如何进行交互的。
那么:在amazonemr中有没有设置配置单元配置属性的方法,如果有,如何设置?
谢谢!
我正在尝试使用amazonemr运行一个配置单元查询,并试图让apachetez也使用它,据我所知,这需要设置 hive.execution.engine
属性到 tez
根据Hive网站?
我知道可以用 set hive.{...}
通常,或者在 hive-site.xml
,但我不知道这两个在amazon emr中是如何进行交互的。
那么:在amazonemr中有没有设置配置单元配置属性的方法,如果有,如何设置?
谢谢!
2条答案
按热度按时间k10s72fa1#
您可以通过两种方式完成此操作:
1) 直接在单个配置单元脚本(.hql文件)中
只需将属性放在配置单元hql脚本的开头,例如:
2) 通过应用程序配置
创建emr集群时,可以指定在整个集群生命周期内工作的配置单元配置。这可以通过aws管理控制台或aws cli实现。
a) aws管理控制台
打开aws emr服务并单击create cluster按钮
单击顶部的“转到高级选项”
请确保在应用程序中选择hive,然后输入如下所示的json配置,您可以在其中找到您通常拥有的所有属性
hive-site
在xml配置中,我突出显示了tez属性作为示例。您可以选择从s3路径加载json。b) aws客户端
如这里详细说明的,您可以在创建集群时使用标志指定配置单元配置
--configurations
,如下所示:json文件的内容与上面管理控制台示例中显示的内容相同。
同样,您可以选择指定s3路径:
xnifntxz2#
amazonelasticmapreduce(emr)是一种自动部署普通hadoop发行版的方法。通常可以在hadoop和hive上运行的命令也可以在emr下运行。
您可以交互地(通过登录主节点)或通过脚本(作为作业“步骤”提交)执行配置单元命令。
您将负责在amazonemr上安装tez。我找到了这个论坛帖子:电子病历上的tez