当我们从hdfs将数据加载到配置单元表中时,它会从源目录(hdfs)中删除文件。有没有一种方法可以将文件保留在源目录中,并将数据加载到配置单元表中。我使用了下面的查询;
LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;
4bbkushb1#
配置单元在将数据加载到表中时不进行任何转换。加载操作目前是纯复制/移动操作,将数据文件移动到与配置单元表对应的位置。使用 hadoop fs cp 或者 hdfs dfs cp 复制(不移动)文件的命令:
hadoop fs cp
hdfs dfs cp
hadoop fs -cp [source_file_path] [table_location_path]
或者
hdfs dfs cp [source_file_path] [table_location_path]
使用 decribe formatted tablename 检查表位置路径的命令。
decribe formatted tablename
1条答案
按热度按时间4bbkushb1#
配置单元在将数据加载到表中时不进行任何转换。加载操作目前是纯复制/移动操作,将数据文件移动到与配置单元表对应的位置。
使用
hadoop fs cp
或者hdfs dfs cp
复制(不移动)文件的命令:或者
使用
decribe formatted tablename
检查表位置路径的命令。