对于hdfs的数据,我们可以
CREATE EXTERNAL TABLE <table> { id INT, name STRING, age INT } LOCATION 'hdfs_path';
但是如何为上面的位置指定本地路径呢?谢谢。
nwwlzxa71#
您可以先使用“hdfs dfs-put”将文件上载到hdfs,然后在此基础上创建配置单元外部表。hive无法在本地文件上创建外部表的原因是,当hive处理数据时,实际的处理发生在hadoop集群上,您的本地文件可能根本无法访问。
kxxlusnw2#
我认为您不能在本地文件系统上创建外部表。最接近的方法是在aws s3 bucket上创建一个外部表,其中 LOCATION 's3://yourbucket/'
LOCATION 's3://yourbucket/'
2条答案
按热度按时间nwwlzxa71#
您可以先使用“hdfs dfs-put”将文件上载到hdfs,然后在此基础上创建配置单元外部表。
hive无法在本地文件上创建外部表的原因是,当hive处理数据时,实际的处理发生在hadoop集群上,您的本地文件可能根本无法访问。
kxxlusnw2#
我认为您不能在本地文件系统上创建外部表。最接近的方法是在aws s3 bucket上创建一个外部表,其中
LOCATION 's3://yourbucket/'