apacheimpala是否可以在从s3读取数据的ec2s(不是emr)上安装/运行?还是需要hadoop namenodes和hdfs才能工作?文档对安装依赖关系不是很清楚。
bd1hkmkf1#
是的, Impala 可以在没有hdfs的情况下运行。hadoop生态系统需要的唯一组件是hivemetastore,它使用它来存储元数据。关于s3的可访问性,您可以参考https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_s3.html
1条答案
按热度按时间bd1hkmkf1#
是的, Impala 可以在没有hdfs的情况下运行。hadoop生态系统需要的唯一组件是hivemetastore,它使用它来存储元数据。
关于s3的可访问性,您可以参考https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_s3.html