hadoop—当我们从hdfs将数据加载到配置单元表中时,它会从源目录(hdfs)中删除该文件

juud5qan  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(295)

当我们从hdfs将数据加载到配置单元表中时,它会从源目录(hdfs)中删除文件。有没有一种方法可以将文件保留在源目录中,并将数据加载到配置单元表中。
我使用了下面的查询;

LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;
4bbkushb

4bbkushb1#

配置单元在将数据加载到表中时不进行任何转换。加载操作目前是纯复制/移动操作,将数据文件移动到与配置单元表对应的位置。
使用 hadoop fs cp 或者 hdfs dfs cp 复制(不移动)文件的命令:

hadoop fs -cp [source_file_path] [table_location_path]

或者

hdfs  dfs cp [source_file_path] [table_location_path]

使用 decribe formatted tablename 检查表位置路径的命令。

相关问题