我使用sqoop进行批量hbase导入。我从sqoop使用这个选项: --hbase-bulkload
. sqoop将生成hfiles并将hfiles导入我的hbase。我可以从sqoop日志中验证数据是否存在,并尝试从中加载hfile
INFO mapreduce.LoadIncrementalHFiles: Trying to load hfile=hdfs://sandbox.hortonworks.com:8020/tmp/sqoop/data/u/2ce542f59b56466d988e49f7a7e512b7 first=\x00\x00\x00\x00\x00\x01\xDE1\xF8 last=\x00\x00\x00\x00\x00\x01\xEB:L
然而,在工作完成之后。我试着看那些文件,但它已经不在了。我正在使用此hadoop命令查看文件:
hadoop fs -ls /tmp/sqoop/data
hfile是否存储在其他地方?或者在导入作业后有保留它的选项?
谢谢
1条答案
按热度按时间myss37ts1#
我已经使用sqoop本身将数据从oracle导入hbase,导入过程完成后,文件存储在hdfs文件系统中
我认为你的hfile也可以存储在同一个概念,所以最好检查一下那里