一个简单的问题,我是 Impala 的新手。我想使用impala将数据从hdfs加载到我的datalake。所以我有一个csv this_is_my_data.csv 我要做的是加载文件而不指定所有扩展名,我的意思是如下所示:
this_is_my_data.csv
LOAD DATA INPATH 'user/myuser/this_is.* INTO TABLE my_table
这是一个以 this_is 不管发生什么。如果你需要更多的信息,请告诉我。提前谢谢。
this_is
x759pob21#
文件上说:您可以指定要移动的单个文件的hdfs路径,或指定目录的hdfs路径以移动该目录中的所有文件。不能指定任何类型的通配符来仅从目录中获取部分文件。解决方法是使用 mv 或者 cp 命令。使用descripe formatted命令检查表目录并运行 mv 或者 cp 命令(在shell中,当然不是impala):
mv
cp
hdfs dfs -mv "user/myuser/this_is.*" "/user/cloudera/mytabledir"
或者先将需要加载的文件放入某个目录,然后再加载所有目录。
1条答案
按热度按时间x759pob21#
文件上说:
您可以指定要移动的单个文件的hdfs路径,或指定目录的hdfs路径以移动该目录中的所有文件。不能指定任何类型的通配符来仅从目录中获取部分文件。
解决方法是使用
mv
或者cp
命令。使用descripe formatted命令检查表目录并运行mv
或者cp
命令(在shell中,当然不是impala):或者先将需要加载的文件放入某个目录,然后再加载所有目录。