我有连接到cloudera Impala 数据的表格。我从metastore读取的表一直在更新,所以当我想更新viz(按f5)时,我必须去cloudera中的impala并在刷新viz之前执行“invalidatemetadata”。我知道这可以通过连接到hiveserver2来完成,但是执行查询需要很长时间。我的问题是,在impalacloudera中是否有自动执行“验证元数据”和“刷新”查询的方法?谢谢,amr公司
ercv8c1e1#
不幸的是,impala还没有提供自动更新元数据的机制。我们正在为将来做这方面的工作,尽管我们还没有将这样的功能提交给特定的版本。同时,你可以做一些事情来让这更容易。首先,表是如何更新的?有新的数据文件吗?如果是这样,您可以运行刷新,这是更快的。另外,确保只使特定表失效/刷新,例如。 REFRESH my_table . 有关详细信息,请参阅文档 [INVALIDATE METADATA][1] 并刷新以获取更多信息。后台是否有一些etl过程?一些用户修改他们的工作流程,以便在更新表后(例如在脚本中)向impala发出刷新命令 impala-shell -i <impalad-host> -q "REFRESH my_table"
REFRESH my_table
[INVALIDATE METADATA][1]
impala-shell -i <impalad-host> -q "REFRESH my_table"
1条答案
按热度按时间ercv8c1e1#
不幸的是,impala还没有提供自动更新元数据的机制。我们正在为将来做这方面的工作,尽管我们还没有将这样的功能提交给特定的版本。
同时,你可以做一些事情来让这更容易。首先,表是如何更新的?有新的数据文件吗?如果是这样,您可以运行刷新,这是更快的。另外,确保只使特定表失效/刷新,例如。
REFRESH my_table
. 有关详细信息,请参阅文档[INVALIDATE METADATA][1]
并刷新以获取更多信息。后台是否有一些etl过程?一些用户修改他们的工作流程,以便在更新表后(例如在脚本中)向impala发出刷新命令
impala-shell -i <impalad-host> -q "REFRESH my_table"