hive中基本上有两种类型的表。 一个是由配置单元仓库管理的托管表,每当您创建一个表时,数据都会被复制到内部仓库。你呢 can not have latest data in the query output . 另一个是外部表,其中包含Hive will not copy its data to internal warehouse . 所以,每当您对表启动查询时,它就会从文件中检索数据。 因此,您甚至可以在查询输出中获得最新的数据。 That is one of the goals of external table. 您甚至可以删除表,并且数据不会丢失。
2条答案
按热度按时间r7knjye21#
hive中基本上有两种类型的表。
一个是由配置单元仓库管理的托管表,每当您创建一个表时,数据都会被复制到内部仓库。你呢
can not have latest data in the query output
.另一个是外部表,其中包含Hive
will not copy its data to internal warehouse
.所以,每当您对表启动查询时,它就会从文件中检索数据。
因此,您甚至可以在查询输出中获得最新的数据。
That is one of the goals of external table.
您甚至可以删除表,并且数据不会丢失。j7dteeu82#
如果你加一个
LOCATION '/path/to/myFile.csv'
子句,您不必更新配置单元中的任何内容。在查询中,它将始终使用文件的最新版本。